开发深度盘点国内四大机器学习开源平台

-的机器学习平台开源大潮中,美国是当之无愧的引领者:无论是谷歌、亚马逊、微软、IBM等互联网巨头,还是美国各大科研院所,为开源世界贡献了品类繁多的机器学习工具。这其中不乏华人的身影,比如开发出Caffe的贾杨清。

但在大陆这边,无论是BAT还是学界,在开源机器学习项目上始终慢了一拍,令人十分遗憾。这与我国世界最大AI研究者社区、占据AI科研领域半壁江山的江湖地位*颇为不符。让人欣喜的是,下半年,百度和腾讯先后发布了它们的开源平台战略。虽然姗姗来迟,但作为下半场入场的选手,它们的开源平台各自有什么意义?本文中,作为机器学习开源项目盘点的第三弹,雷锋网将与你一起看看包括百度腾讯平台在内的国内四大开源项目。

*注:据创新工场人工智能工程院王咏刚副院长统计,我国AI发文数与引用文章数居世界第一,占世界总数一半以上。

1.百度:希望获得开发者青睐的“PaddlePaddle”

年9月1日的百度世界大会上,百度首席科学家吴恩达宣布,该公司开发的异构分布式深度学习系统PaddlePaddle将对外开放。这标志着国内第一个机器学习开源平台的诞生。

其实,PaddlePaddle的开发与应用已经有段时日:它源自于年百度深度学习实验室创建的“Paddle”。当时的深度学习框架大多只支持单GPU运算,对于百度这样需要对大规模数据进行处理的机构,这显然远远不够,极大拖慢了研究速度。百度急需一种能够支持多GPU、多台机器并行计算的深度学习平台。而这就导致了Paddle的诞生。自年以来,Paddle一直被百度内部的研发工程师们所使用。

而Paddle的核心创始人,当年的百度深度学习实验室研究员徐伟,现在已是PaddlePaddle项目的负责人。

徐伟

对了,从“Paddle”到“PaddlePaddle”的命名还有一个小插曲:Paddle是“ParallelDistributedDeepLearning”的缩写,意为“并行分布式深度学习”。而去年9月发布时,吴恩达认为“PaddlePaddle”其实更郎朗上口、更好记,于是就有了这么个可爱的名字。

那么,PaddlePaddle有什么特点?

支持多种深度学习模型DNN(深度神经网络)、CNN(卷积神经网络)、RNN(递归神经网络),以及NTM这样的复杂记忆模型。

基于Spark,与它的整合程度很高。

支持Python和C++语言。

支持分布式计算。作为它的设计初衷,这使得PaddlePaddle能在多GPU,多台机器上进行并行计算。

相比现有深度学习框架,PaddlePaddle对开发者来说有什么优势?

首先,是易用性。

相比偏底层的谷歌TensorFlow,PaddlePaddle的特点非常明显:它能让开发者聚焦于构建深度学习模型的高层部分。项目负责人徐伟介绍:

“在PaddlePaddle的帮助下,深度学习模型的设计如同编写伪代码一样容易,设计师只需







































白癜风植皮
北京中科白癜风医院正规的吗



转载请注明:http://www.jiaju1314.com/bcxx/bcxx/11514.html