5G行业_5G赋能_千行百业_5G赋能_无所不能 网上高新区_云上科技园 科技商圈_创业大街_商贸圣地_云上商圈_信息共享  网上石牌村_云上华强北 科技园区_企业宣传_产品推广_招商招投_服务共享 网上三好街_云上中关村 科所院校_院校宣传_专业推介_成果展示_校企合作 网上科技展_云上博览会 网上太升路_云上磨子桥
推广 热搜: Tiktok  Facebook  通讯  研究  马云  华为  大学  北斗  中国移动  园区  大数据  任正非 

微软亚洲互联网工程院:大规模语言模型的技术趋势和落地实践

放大字体  缩小字体 日期:2021-08-15     来源:搜狐号    作者:云科技时代    浏览:42422    评论:0    
核心提示:在人工智能领域,大规模语言模型正取得迅猛的发展。所谓大规模语言模型,即参数规模达到千亿至上万亿的深度学习神经网络模型。大
 

在人工智能领域,大规模语言模型正取得迅猛的发展。所谓大规模语言模型,即参数规模达到千亿至上万亿的深度学习神经网络模型。大规模语言模型究竟有多神奇?被喻为“深度学习三巨头”之一的Geoffrey Hinton,也是2018图灵奖获得者,就此诙谐评价:“生命、宇宙和万物的答案,就只是4.398万亿个参数而已”。“4.398万亿”这个数字是如何得出的?其实,4.398万亿是2的42次方,而“生命、宇宙和万物的终极答案是42”则是科幻小说《银河系漫游指南》中的经典桥段。4.398万亿虽然没有什么科学依据,但Geoffrey Hinton的评论足以让大规模语言模型获得广泛的关注。

2018年底BERT模型的问世,标志着大规模语言模型的诞生。基于BERT,OpenAI推出了GPT2模型,达到了15亿参数。GPT2模型是首次参数达10 亿量级,后面就越来越像军备竞赛: 2020年3月,微软推出了图灵模型,参数量达到了170亿;三个月后的GPT3又把参数量翻10倍,达到1780亿;之后,谷歌的Switch Transformer达到了万亿参数。在中国,华为盘古达到了1000亿、鹏程盘古-α达到2000亿,阿里达摩院M6达到1万亿,智源悟道达到1.75万亿。

那么,现在的大规模语言模型都有哪些技术趋势以及哪些落地实践?微软全球合伙人、微软亚洲互联网工程院副院长、首席科学家姜大昕博士在近期的华泰证券“行知”新经济云峰会数字科技专场,介绍了大规模语言模型的技术趋势和落地实践。姜大昕表示,目前NLP自然语言处理处于一个美好的时代,虽然还有很多问题没有解决,但已经有很多成功的商业应用。随着面向NLP的大规模语言模型的工程化落地,将打开数字化转型的新阶段。

 
反对 0举报 0 收藏 0 打赏 0

中国通讯市场网版权及免责声明:

1、凡本网注明“来源:中国通讯市场网”及其作者的作品,版权均属于中国通讯市场网。未经允许禁止转载、摘编及镜像,违者必究。对于经过授权可以转载我方内容的单位,也必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和本站来源。
2、凡本网注明“来源:XXX(非中国通讯市场网)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。
3、如因作品内容、版权和其它问题需要同本网联系的,请在相关作品刊发之日起30日内进行,在网站留言(请点击)处留言。
打赏
 
 
更多>同类通讯信息
0相关评论

推荐图文
推荐通讯信息
点击排行
网站首页  |  关于网站  |  关于我们  |  联系方式  |  隐私政策  |  网站地图  |  排名推广  |  展位宣传  |  网站留言  |  RSS订阅  |  违规举报  |  蜀ICP备12021778号-1