关于预测解决方法

   阅读
关于预测
我们公司是做图书馆管理系统的,然后现在我自己一个人在做统计分析系统,就是对图书馆管理系统的业务数据进行统计分析。后来老大说XXX统计分析系统这个名字不好,就改了,改成了XXX决策支持系统,就是要在当前统计的数据的基础上对未来数据进行预测,用来辅助决策。
  统计的业务数据有很多,这里就说一部分吧,就是关于图书馆每天的借出量、还回量、损坏、丢失等等。
  关于预测这方面我也找了一部分资料,比如指数平滑预测,但是这个预测方法不能跨期预测,比如:我以一天为一期,这样我预测明天的数据,就只需要今天的实际业务量和预测业务量,但是如果我要预测后天的,就不行了,因为后天的依赖于明天的实际业务量。好像一些预测算法都是这样的。
  有没有比较好的想法,求教育啊...

------解决方案--------------------
没有做过相关的系统,不过既然有数据可以依赖而推测,类推一下就可以了
比如可以根据今天的数据预测明天的结果,那么后天的结果就可以用明天的预测结果作为基础来预测
毕竟这只是预测,不可能很准确地反映真实结果,但是作为预测,可以知道个大概方向
所以每天的预测结果可以用前一天的预测作为基础去推测,这样递归一下就可以了
比如
f(n) = f(n-1)*a; //a是个修正系数,
那么f(明天)=f(今天)*修正系数
f(后天)=f(明天)*修正系数
。。。
依次类推

------解决方案--------------------
这个命题太大了啊,根本就是数据模型的战争。

我认为首先应该先大范围人工粗略分析数据模型的特征,比如:
◎ 是否存在每周特征?比如都是周一周二还书高峰,周四周五借书高峰?
◎ 是否存在每月特征?比如都是月初还书、月底还书高峰?
◎ 是否存在每年特征?比如是否每年都是春季借书多,秋季还书多?
◎ 春节、端午、国庆?是否放假前都有个借书高峰?放假后还书高峰?
◎ 当然,也许上述特征都不存在;但我觉得一定会有些特征的。

然后再根据特征来选择合适的模型,或者将某几个模型进行组装。

我们经常会用到的是 同比数据 和 环比数据。
同比:也就是用去年同期的数据规则,结合今年的数据量,去预测下一个时间点或时间段的可能情况。
环比:也就是用上个月、或上个季度的数据规则,结合当期的数据量,来进行后续预测。

从我个人的经验来说,同比数据和环比数据的规则,比直接用近期数据做预测,要更有效些。


比如:去年图书损坏率如果是 5%,今天基本上也会是 5% 上下,除非突然火灾或者图书馆搬家啥的(突发事件导致的模型调整)。
------解决方案--------------------
探讨
我之前就是你这样做的,但是这样的话预测的数据趋势都是一样的,比如我要预测某个月每天的数据,这样预测出来的每天的数据基本上相同。后来网上看了指数平滑预测法,你说的那种就不行了,因为后一天要依赖于前一天的实际值和预测值。

引用:

没有做过相关的系统,不过既然有数据可以依赖而推测,类推一下就可以了
比如可以根据今天的数据预测明天的结果,那么后天的结果就可以用明天……

------解决方案--------------------
探讨

这个命题太大了啊,根本就是数据模型的战争。

我认为首先应该先大范围人工粗略分析数据模型的特征,比如:
◎ 是否存在每周特征?比如都是周一周二还书高峰,周四周五借书高峰?
◎ 是否存在每月特征?比如都是月初还书、月底还书高峰?
◎ 是否存在每年特征?比如是否每年都是春季借书多,秋季还书多?
◎ 春节、端午、国庆?是否放假前都有个借书高峰?放假后还书高峰?
◎ 当然,也许上述特征都不……

------解决方案--------------------
探讨

数据不是很多吧,反正就是每天一条数据,记录当天所有的借出、还回等等的数量。图书馆的每天流通量是挺有规律的,比如周末读者会多一些,而且相近的几个周末流通量相差没有多少。某些假日也会多。平常非周末和非节假日会少一些。
至于预测未来哪一天,这个由他自己选择啊,可以是某一天,也可以是某一月。
决策的话,你说的这个是一方面,比如预测到哪天会出现异常,流通量会出现大幅度增加,就会……
阅读