<专访POWER 8编程挑战赛选手孙冬冬:从C语言到人工智能、深度学习的技术演变,  由CSDN和IBM联合举办的”自正式启动以来,受到了许多编程爱好者及程序员们的关注科技资讯网
您的位置首页  科技生活  人工智能

专访POWER 8编程挑战赛选手孙冬冬:从C语言到人工智能、深度学习的技术演变

  由CSDN和IBM联合举办的”自正式启动以来,受到了许多编程爱好者及程序员们的关注。该大赛以云计算的方式为开发者提供了POWER 8开发,开发者将利用POWER 8的特性,基于不同场景进行应用开发。

  此次大赛主要面向广大CSDN注册开发者,大赛以云计算的方式为开发者提供了Power 8开发,开发者利用Power8的特性,基于不同场景进行应用开发。此次大赛,不仅使更多的开发者充分利用了Power8,也为开发者、技术达人提供一个展示的舞台。

  第一期“博客反垃圾”挑战赛已顺利结束,共有1072人参赛。我们采访了部分参赛选手(专访一)、(专访二)、(专访三),他(她)们表示:参赛不仅让自己得到了更好地锻炼,而且还把IBM Power8独特的并发优势发挥到了极致,收获颇丰。

  这不,在大家的热切下,我们又迎来了极限算法挑战赛第二期,本期挑战赛的题目是“词大文本过滤”,具体任务为由CSDN提供博客数据与词词库,参赛选手编写算法将含有词的博客分离出来。需要说明的是,大赛主要考察程序的是算法的正确率及处理速度,对开发语言、开发工具并不进行限定。

  到目前为止,已经有数百名开发者报名并参加了此次大赛,为了让更多的开发者了解此次大赛的进展情况,日前,我们专访了其中一位参赛选手中国科学技术大学研究生孙冬冬,希望通过他的参赛经历,吸引更多的技术达人参与到大赛之中。

  孙冬冬:我从大一开始接触编程,那时候刚学C语言,本科专业是电子信息工程专业。所以大学期间用MFC做了一些串口通信的工具。慢慢的对软件开发产生了浓厚的兴趣。读研以后开始学习一些脚本语言如Perl,Python等。也做过一些简单的Web开发。目前从事文本挖掘方向的研究,主要关注大数据和人工智能方面的技术,尤其是DL(深度学习)。

  2.关于您算法设计的思,主要用到了什么计算模型?请简单描述一下设计算法的基本思?

  孙冬冬:我主要用的是词提取中最常用的DFA(确定有限自动机)模型,同时使用了正则表达式对一些宽泛的词做处理。为了增加算法的执行效率,我们用standford parse事先对句子做了分词的处理。有效地减少了计算的复杂度。

  3.相对于其他方式您之所以选择这一模型,主要是源于哪方面的优势?是否还有继续优化的可能?

  孙冬冬:DFA算法是很常见的算法,广泛的运用在文本挖掘方面。同时大量的实践表明DFA算法基本上不需要多少计算。目前在自己的服务器上跑出的性能还不错。接下来加入一些自然语言处理的算法对数据再进行有效的预处理。相信还是有优化的可能。

  4.基于这一思的算法设计,能否充分发挥IBM Power8的多线程计算优势?您是否尝试过比较多线程与单线程的性能差距?

  孙冬冬:运算的数据量较大。同时正则匹配的运算复杂度也较高。通过有效的程序实现,应该能够充分发挥IBM Power8的多线.对于IBM Power 8,你最关注的技术要点是什么?能否谈谈对未来这一领域技术趋势的看法?

  孙冬冬:我们知道其实现在并发运算框架,大部分时间花在了线程通信上。用在计算上的时间比例其实并不多。怎么有效地降低通讯时间,而把大量的工作用在大数据的计算上是我比较关注的。

  6.对于多线程及并发编程技术的发展,你怎么看?你认为还有哪些可以改进的方面?

  孙冬冬:大数据,云计算,以及人工智能时代的到来,多线程及并发编程技术应用的会越来越广泛。

  孙冬冬:首先,在实验室学了两年的文本挖掘终于有了实战的机会。同时对于大数据与自己平时做的小样本的处理方法不同有了深刻的理解。很感谢CSDN举办的这次活动,接下来的两场竞赛我都会参加。对活动的是能不能做点赛前培训,线上的即可。

免责声明:本站所有信息均搜集自互联网,并不代表本站观点,本站不对其真实合法性负责。如有信息侵犯了您的权益,请告知,本站将立刻处理。联系QQ:1640731186
友荐云推荐