投稿指南
一、稿件要求: 1、稿件内容应该是与某一计算机类具体产品紧密相关的新闻评论、购买体验、性能详析等文章。要求稿件论点中立,论述详实,能够对读者的购买起到指导作用。文章体裁不限,字数不限。 2、稿件建议采用纯文本格式(*.txt)。如果是文本文件,请注明插图位置。插图应清晰可辨,可保存为*.jpg、*.gif格式。如使用word等编辑的文本,建议不要将图片直接嵌在word文件中,而将插图另存,并注明插图位置。 3、如果用电子邮件投稿,最好压缩后发送。 4、请使用中文的标点符号。例如句号为。而不是.。 5、来稿请注明作者署名(真实姓名、笔名)、详细地址、邮编、联系电话、E-mail地址等,以便联系。 6、我们保留对稿件的增删权。 7、我们对有一稿多投、剽窃或抄袭行为者,将保留追究由此引起的法律、经济责任的权利。 二、投稿方式: 1、 请使用电子邮件方式投递稿件。 2、 编译的稿件,请注明出处并附带原文。 3、 请按稿件内容投递到相关编辑信箱 三、稿件著作权: 1、 投稿人保证其向我方所投之作品是其本人或与他人合作创作之成果,或对所投作品拥有合法的著作权,无第三人对其作品提出可成立之权利主张。 2、 投稿人保证向我方所投之稿件,尚未在任何媒体上发表。 3、 投稿人保证其作品不含有违反宪法、法律及损害社会公共利益之内容。 4、 投稿人向我方所投之作品不得同时向第三方投送,即不允许一稿多投。若投稿人有违反该款约定的行为,则我方有权不向投稿人支付报酬。但我方在收到投稿人所投作品10日内未作出采用通知的除外。 5、 投稿人授予我方享有作品专有使用权的方式包括但不限于:通过网络向公众传播、复制、摘编、表演、播放、展览、发行、摄制电影、电视、录像制品、录制录音制品、制作数字化制品、改编、翻译、注释、编辑,以及出版、许可其他媒体、网站及单位转载、摘编、播放、录制、翻译、注释、编辑、改编、摄制。 6、 投稿人委托我方声明,未经我方许可,任何网站、媒体、组织不得转载、摘编其作品。

横扫6大AI榜单后,阿里将这一顶级语言AI开源

来源:语言研究 【在线投稿】 栏目:综合新闻 时间:2021-06-22
作者:网站采编
关键词:
摘要:智东西(公众号:zhidxcom) 作者 | 心缘 编辑 | 漠影 智东西6月22日报道,今日,阿里巴巴达摩院正式宣布已开源预训练语言模型体系AliceMind。 日均调用量超过50亿次、活跃场景超过200个

智东西(公众号:zhidxcom)

作者 | 心缘

编辑 | 漠影

智东西6月22日报道,今日,阿里巴巴达摩院正式宣布已开源预训练语言模型体系AliceMind。

日均调用量超过50亿次、活跃场景超过200个、登顶六大NLP权威榜单,AliceMind身上有许多荣耀的战绩,并入选了2021年世界人工智能大会最高奖项SAIL奖TOP30榜单。

作为阿里的语言技术底座,AliceMind正在让机器学会说“人话”的道路上一路快跑。

达摩院深度语言模型团队负责人黄松芳告诉智东西,AliceMind生态体系完整,能力全面,希望通过开源,推动NLP行业研究突破和应用创新。

开源地址: src="http://p1.qhimgs4.com/t014204db82a2b9e8cb.jpg">

AliceMind体系内的模型登顶六大NLP榜单

截至5月,AliceMind体系内的主要工作已登顶GLUE、CLUE、XTREME、VQA Challenge、DocVQA、MS MARCO等六大NLP权威榜单。

其中的多语言、多模态、结构化预训练三个模型均被国际学术顶会ACL 2021录取。

6月19日,AliceMind体系中的多模态模型StructVBERT,再次登顶多模态权威榜单VQA Challenge 2021。

这个比赛类似看图问答,给定一张图像和关于图像的自然语言问题,AI需要提供准确的自然语言答案。AliceMind战胜了微软、Facebook等几十家国际顶尖团队,将纪录从去年第一的76.36%显著提升到超过79%,接近人类水平(80.78%)。

AliceMind登顶VQA Challenge 2021榜单

除了上述6种模型外,AliceMind模型体系还包括超大模型PLUG、知识驱动LatticeBERT等模型。

中文预训练模型PLUG在两个月前刚刚发布,因为高达270亿的超大规模参数,在业界猛刷了一把存在感。黄松芳透露道,PLUG开源目前正在规划中。

目前AliceMind已上线到内部平台,开箱即用,支持继续训练、精调、蒸馏、测试、部署五大功能,只需简单操作,即可完成语言模型从训练到部署的完整链路。

AiNLP管控台

二、已落地数十个应用,助推AI进入大工业时代

开源AliceMind,会带来哪些好处?

达摩院深度语言模型团队负责人黄松芳告诉我们,对于阿里而言,语言模型的落地应用是一个系统工程,不是一个企业能做成的。

因此,通过开源,阿里希望和社区一起来推动语言模型的落地,也在这个过程中,进一步完善和提升AliceMind。

对于外部来说,AliceMind开源降低业界研究和创新应用的门槛,助推语言AI进入大工业时代。

外部开发者可以基于此,快速地搭建智能的NLP引擎,大大降低对于人工标注数据的依赖,也降低了AI从业者的入门门槛。

更重要的是,这将能够大幅提升改善或者超过传统机器学习方法效果。

如果用炼钢来类比,以前训练一个NLP模型,得从铁矿石开始炼钢,周期长,费用高,产量低。

而开源预训练语言模型的好处在于,已经给你提供了现成的粗钢,你需要做的,只是将粗钢炼成所需的特定钢材,这使得开发效率大为提升。

此前,AliceMind已具备阅读、写作、翻译、问答、搜索、摘要生成、对话等多种能力,落地于跨境电商、客服、广告等数十个核心业务应用。

AliceMind诗词生成示例

以云小蜜智能客服场景为例,StructBERT和PALM等模型被深度运用于FAQ匹配、QA挖掘和Paraphrase数据增强等业务,其中匹配模型帮助将政务行业top1准确率提升2.9%,并支持了疫情问答在九个地市机器人上线应用。

在阿里之外,AliceMind还被应用于医疗、能源、金融等多个行业。

比如,在电力能源领域,浙江电网公司以AliceMind为底座为员工构建了智能化运维平台,应用于变压器检修、供电抢修等业务,已开始在国家电网公司统一推广。

再比如,AliceMind在阿里云医疗行业应用于病历质检和健康档案产品,落地几十家医院。

而在AliceMind开源后,它将进一步推动语言AI走向可规模化复制的大工业时代。

AliceMind官网:https://nlp.aliyun.com/portal#/alice

三、体系内的不同模型:各有侧重,理念共通

总体来看,AliceMind具有覆盖模型全面、技术领先、开放普惠的特点,它将围绕“预训练+精调”语言模型持续进行生态性的技术开源。

在“预训练”阶段,模型从大规模文本中学习到词与词的搭配关系,及句子之间的上下文关系等语言通用知识。

文章来源:《语言研究》 网址: http://www.yyyjzzs.cn/zonghexinwen/2021/0622/994.html



上一篇:横扫六大权威榜单后 阿里达摩院开源深度语言模
下一篇:孩子会写不会说中国欠缺的“语言表达教育”,

语言研究投稿 | 语言研究编辑部| 语言研究版面费 | 语言研究论文发表 | 语言研究最新目录
Copyright © 2018 《语言研究》杂志社 版权所有
投稿电话: 投稿邮箱: