《智能时代》读书笔记

总结了一下华为软挑比赛,同时整理了一下量子机器学习的代码学习资料,并对二维MERA结构进行了数据集拓展、阅读《智能时代》。

算法实践

本周将假期学的Quantum Tensor Network in Machine Learning An Application to Tiny Object Classification这篇论文的代码又重新复习了一下,作者通过二维的张量网络结构进行小目标分类。而医学图像,尤其对新冠肺炎图像,它也属于这种小目标图像的范畴。因为该论文讨论的是二维的MERA结构,能够保留图片的局部信息,那么它的识别效果应该比单MPS架构要好很多,并且相比GTNC这里用到极少的环境变量,响应需要更新的参数也会少很多。因此这次实验主要从识别精度、参数量、运行时间三个角度进行评估。

在代码方面较之前增加了MERA的层数以应对更大的图片,同时增加了对新冠肺炎图片的处理和读取(loader模块),修改了MPS的输入输出参数,使得MERA各个层之间传递的bond对应起来。关于实验结果,由于新馆肺炎图像比较大,处理起来比较慢,因此还没有得到完整的结果

《智能时代》

几个体现数据作用的例子

  1. 托勒密小圆套大圆来求星星运动轨迹,这种想法影响了人类一千多年
  2. 日本的公司根据王进喜大庆油田的照片推断出一系列油田相关的信息,一举中标
  3. 盖洛普利用统计学+数据问卷收集民意,成功预测美国大选
  4. IBM的语音识别基于数据的突破
  5. 量变到质变,Google机器翻译打败传统AI(手动编写语法逻辑)

如果说数据的相关性我还知道一些的话(之前做过基于Apriori的关联分析),那么数据的完备性则是我平时一直忽略的点。数据的完备性指的是,你的样本要尽可能的涵盖大部分的情况或者对象。举个例子而言,比如预测大选的时候,调研不能只考虑精英那批人的意见,而要收集到各个阶层、不同收入、不同知识文化水平等人的完整意见,这样能够使得样本尽可能的完整,这方面的例子有Google机器翻译、斯维尔预测50+1州投票情况。

另外就是从托勒密到伽利略、再到牛顿、瓦特、莱特兄弟,他们都是基于机械思维,这种思维是改变了人类工作方式的革命性的方法论,并且在工业革命和全球工业化中起到了决定性的作用。但今天我们面临的复杂情况,已经不在能用几个定律就讲清楚了,难以找到确定性是现在社会的常态。而大数据科学基础是信息论,它的本质就是利用信息消除不确定性。大数据时代,量变带来质变,信息论的思维让过去很多问题迎刃而解。一个典型的例子就是Google和Microsoft搜索引擎之争,这完全是数据层面的竞争。尽管Microsoft的搜索算法同样先进,但他的Bing显然没有Google那么庞大的历史搜索记录,因此就很难去进一步提高结果推荐质量。可见数据的竞争,尤其是大数据对各行各业、各个领域都产生了革命性的作用。

将大数据的思维应用到医学图像领域的分析中来,要想用数据去遍布各个病例,那就要求医院能够提供大量的样本。而实际生活中,各个医院可能还没有在各种设备中有意识的收集数据,并且不同医院采用不同的管理系统,采用不同的设备处理信息,因此可能得到的数据会因设备参数而产生差异,再加上有些病例比较罕见。这种种原因意味着医学大数据还需要沉淀和积累,于是目前大家普遍采用的还是基于机械思维的图像分割算法,通过对医学图像的各种基于规则的分割,把图片的特征提取出来,然后再进行建模和预测。

  • Copyright: Copyright is owned by the author. For commercial reprints, please contact the author for authorization. For non-commercial reprints, please indicate the source.

扫一扫,分享到微信

微信分享二维码
  • Copyrights © 2015-2024 YuleZhang's Blog
  • Visitors: | Views:

请我喝杯咖啡吧~

支付宝
微信