报告1:
报告题目:Python 数据采集、分析与可视化
报告人:吴秀芹
报告时间:2019年10月31日14:00--14:45
报告地点:1D-305
内容简介:Python是一种计算机程序设计语言。是一种面向对象的动态类型语言,最初被设计用于编写自动化脚本(shell),随着版本的不断更新和语言新功能的添加,越来越多被用于独立的、大型项目的开发。自从2004年以后,python的使用率呈线性增长。2011年1月,它被TIOBE编程语言排行榜评为2010年度语言,目前已经成为最受欢迎的程序设计语言之一。由于Python语言的简洁性、易读性以及可扩展性,在国外用Python做科学计算的研究机构日益增多,一些知名大学已经采用Python来教授程序设计课程。众多开源的科学计算软件包都提供了Python的调用接口,例如著名的计算机视觉库OpenCV、三维可视化库VTK、医学图像处理库ITK。而Python专用的科学计算扩展库则更多。 Python语言及其众多的扩展库所构成的开发环境十分适合工程技术、科研人员处理实验数据、制作图表,甚至开发科学计算应用程序。
报告2:
报告题目:大数据之hadoop介绍
报告人:王永安
报告时间:2019年10月31日14:45--15:30
内容简介:Hadoop是一个由Apache基金会所开发的分布式系统基础架构,原本来自于谷歌一款名为MapReduce的编程模型包。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。Hadoop的框架最核心的设计就是:HDFS和MapReduce。HDFS为海量的数据提供了存储,则MapReduce为海量的数据提供了计算。使用该框架的一个典型例子就是在网络数据上运行的搜索算法。Hadoop目前已经迅速发展成为分析大数据的领先平台。很多公司开始提供基于Hadoop的商业软件、支持、服务以及培训。Hadoop 设计之初的目标就定位于高可靠性、高可拓展性、高容错性和高效性,正是这些设计上与生俱来的优点,才使得Hadoop一出现就受到众多大公司的青睐,同时也引起了研究界的普遍关注。