Thursday, December 31, 2015

选择一个有用的理念(22)

.
隐藏层的神经元数是通过实验确定的,对任何一个类似股票或期货价格预测的非线性问题,网络至少需要有一个隐藏层.此外,传递函数应该是一个非线性的、可以不断微分的函数,比如 s 形的,允许网络执行非线性的统计模拟。图 5-8 介绍了一个隐藏神经元的例子。


输入数据选择和处理

神经系统网络建立在开发者对现实世界的输入和输出之间关系的理解的基础上。作出的决定必须与将要预测什么以及网络需要什么样的输入数据有关。“无用输入,无用输出”也同样适用于神经系统网络对金融市场的认识以及对各种工其的使用,比如寻找各相关市场间的关联的基本成分分析,对于正确地选择输入数据都是必需的,一旦输入数据被选出后,就必须进行加工。通过减小网络的输入,可以使认识变得更简单。两种被广泛使用的加工方法就是我们所知的“转化”和“统一化”:转化是通过对原始数据输入的操作,向网络产生一个单精度的输入,统一化则把输入的单精度数据转化,均匀分布,并把这些数据缩放以匹配输入神经元的范围。

在神经系统网络的许多应用中,转化包含着对输入数据的代数的和统计的操作:在金融预测应用中,有着各种各样的用来解释市场行为的技术指标,这些指标都可用作转换的工具。预处理后的输入可能会含有差别。比例,以及开盘、最高、最低、收盘、成交量及开盘利息原始数据的移动平均等。输入层中的每个神经元都代表着一个经过预处理后的输入。

既然对于某些特定的应用来说,肯定存在一些更好的转化和统一化方法,我们就可以自己探索各种各样的方法。一旦选定了网络体系结构,并且输入的数据经过选择和预处理后,就必须选择数据事实。

事实选择 事实是以一行相关的数字表示的,在这行数字里,第一个i数字与i网络输入相关,第j个数字与J网络输出相关。一堆相关的事实组合就叫做“事实集”。如果两个事实有完全相同的输入和输出值,那么就只能有一个事实被归到事实集中。一旦定义了这个事实集,在大多数金融应用中,它就会被分成一些相互排斥的训练和测试子集。

向后传播的网络以两个模式运作:一个是学习模式,网络使用来自训练集的事实,通过改变它们的权重来更改它的内在表达:另一个就是回忆模式.网络处理来自测试集的输入。并利用先前学会的表达产生相关的输出。应该把测试集对各种训练网络的相对表现用来决定哪个网络包含进金融应用中。

(作者:范·K·撒普博士)
.

No comments:

Post a Comment