构建中国自主AI工具包,上海临港人工智能开发者大会新锐开发者探讨痛点难题

2019-12-06 16:37 来源: 未知

随着第三波人工智能浪潮的兴起,全球人工智能进入高速发展的阶段。近年来,中国、美国、加拿大等国家纷纷把人工智能升级为国家级发展战略,尤其中美之间,人工智能技术发展竞争态势日渐激烈。 为了抢抓人工智能发展的重要战略机遇,中国已将人工智能上升为国家战

随着第三波人工智能浪潮的兴起,全球人工智能进入高速发展的阶段。近年来,中国、美国、加拿大等国家纷纷把人工智能升级为国家级发展战略,尤其中美之间,人工智能技术发展竞争态势日渐激烈。

为了抢抓人工智能发展的重要战略机遇,中国已将人工智能上升为国家战略,加快建设创新型国家和世界科技强国。2017 年 7 月,中国颁布《新一代人工智能发构建中国自主AI工具包,上海临港人工智能开发者大会新锐开发者探讨痛点难题展规划》,包含了研发、工业化、人才发展、教育和职业培训、标准制定和法规、道德规范与安全等各个方面的战略和发展目标,可谓是所有国家人工智能战略中最为全面的规划。

在这样的时代背景下,上海市政府积极顺应趋势,颁布了《关于本市推动新一代人工智能发展的实施意见》,借助上海的产业基础、人才基础和赋能生态环境等优势,为上海人工智能产业发展提供了优渥的土壤。

为进一步贯彻落实习近平总书记“推动我国新一代人工智能健康发展”的重要指示,加快建设人工智能“上海高地”,构建国际一流人工智能产业生态,由世界人工智能大会组委会指导,上海市经济和信息化委员会、中国(上海)自由贸易试验区临港新片区管理委员会、上海临港经济发展(集团)有限公司主办的「WAIC 开发者·临港人工智能开发者大会」于12月6日在上海临港开幕。

作为WAIC开发者日的重要延续,该大会以开发者关心的话题为核心,设置了主题演讲、公开课、开发者工作坊、黑客松、技术和产业闭门研讨会等环节,为全球优秀的人工智能开发者们提供一个学术交流、技术探讨和沟通合作的平台。

在上午的主题演讲环节,商汤科技联合创始人兼 CEO 徐立、依图科技联合创始人林晨曦、谷歌研究科学家/普林斯顿大学计算机科学系教授 YoramSinger、南京大学人工智能学院教授俞扬等来自AI领域的重磅嘉宾为参会者们分享了不同的技术主题。而之后的新锐开发者对话环节,也是上午主会议的另一大亮点。

在人工智能新锐开发者对话环节,华为开源生态主任工程师黄之鹏和领规科技创始人黄康两位开发者代表围绕「中国自主的AI工具包」这一热门话题展开了讨论。

随着中美在AI方面的竞争愈发激烈,中国AI基础设施建设方面的现状和发展问题,也引发了越来越多的关注和讨论。很多业内人士认为,目前国内有很多AI公司都取得了商业上的成功,但在底层核心技术方面,中国公司依然非常依赖美国的AI工具包,以深度学习框架为例——谷歌TensorFlow框架和Facebook的Pytorch框架最为流行。这个问题被视为中国AI生态系统的一大缺口。

黄之鹏目前担任华为开源生态主任工程师,负责开源团队,并参与了OpenStack、Kubernetes、CNCF、ONNX、MLSpec、OpenSDS、Akraino等开源社区的系列工作。他表示,「AI工具包都在美国手里」这个命题其实是有问题的,因为大众所理解的AI工具包是狭义的,比如说深度学习框架TensorFlow、Pytorch,但实际业界在做人工智能研发时所用到的工具包是远远超过这个的。例如,我们编译用的编译器,更广泛意义上,刚才讲的强化学习模拟器,这些可能会用到很多新的工具。从这个意义上来说,我们不是弱,是弱了很多,我们看到大量的包都不是源自中国。」

而中国在构建AI生态方面,是不是把所有的软件自己写一遍就解决问题了?其实不是的。黄之鹏认为,很多思路是静态的,从静态的角度补齐软件,不是类别齐全就可以的。其实AI生态的建立是一个动态发展的过程,对中国开发者来说,我们差在能够像TensorFlow、PyTorch这样讲一个全球性AI工具的故事,怎么建立一个以中国开发者为主但是面向全球的社区,这个是我们在开源这块做得不太足的地方。

黄康是北京航空航天大学博士,也是领规科技的创始人。领规科技主要致力于全球语种智能助手和端侧AI数据智能技术产品,拥有多名Google TensorFlow Lite和Kaldi项目Contributor。

黄康博士非常赞同黄之鹏的观点,他认为完整的AI工具包应该是非常大的,今天我们可能看到最热门的工具包是PyTorch和TensorFlow。但是工具包也处在一个飞速的发展过程中,他相信随着大家开源意识越来越好,知识越来越多,包括经费和人才的加入,未来肯定会有所超越。

而回到议题本身,在今天的时代背景下,我们应该怎么建设中国自有的AI工具包?

黄康表示:第一,我们要对来自于国外的工具包非常熟悉,甚至知道里面的运行原理是怎么回事,这样才能结合目前已有的工业化、产业化的场景去做很好的适配。

第二,除了工具包之外,专利可能是一个更加严重的问题,因为我们知道在过去的2-3年间,谷歌发布了关于深度学习基础算法或者理论框架的专利,这个专利可能会影响我们整个后续包括工具包的使用,

黄之鹏则表示,国外的开源社区(TensorFlow、PyTorch)也并不是都能达到所谓的完美状态,比如TensorFlow 2.0的发布犯了开源社区的大忌——不是互相兼容的,很多用户被晒在那里,还停留在1.6、1.8的版本,所以说国外主流的开源社区也是在一步一步走。除了华为的技术能力之外,包括明年会开源的MindSpore,自己也会负责社区运营,做一个好的社区生态,其实是非常重要的。

第二,专利是现在大家误区非常多的一个地方,国内做开源原动力不太足,大家一提到开源,反应就是这个东西扔出去了,白做了,其实不是的。即便是最友好的一些开源工具,也规定了在一定的时间和空间程度上的授权。像黄康老师说的一定要注意专利的编写,我们也要好好地写这个专利。

此外,「易用性」也是开发AI工具包要特别注重的特性。

有多年企业开发经验的黄康表示,「对要做开源社区或者是开源工具的开发者小伙伴来说,一定要把产品的应用性放在一个特别好的位置。」

同样,从工程角度来说,华为一直非常重视易用性问题。黄之鹏说,「等到MindSpore明年Q1开源出来之后,可以支持一键动态图和静态图的切换,我们做了很多的抽象,帮助开发者尽可能地减少学习曲线。相比之外,TensorFlow 的学习曲线是比较陡的,尤其是在2.0版本推出以后,这条曲线变得更陡。」

最后,两位新锐开发者都认为在AI生态的建设中,除了业界,高校力量也是重要一环,应该起到表率作用。国内也应该大力支持中国开发者创新,构建中国自主的AI工具包。

编辑: 2ad3min11