一年后,拥有2k+ 星的代码被批准为SC22。

2024-09-16 04:39:56 | 作者: 匿名

AI Lab NLP火山翻译团队论文被超级计算领域国际顶级会议SC22接收

近日,AI Lab NLP 火山翻译团队的工作《LightSeq2: Accelerated Training for Transformer-based Models on GPUs》被超算领域顶级会议SC22 接收。 SC 被认为是一个可以看到并使用未来技术来解决世界级问题的会议。

SC会议的全称是“国际高性能计算、网络、存储和分析会议”(The International Conference for High Performance Computing, Networking, Storage, and Analysis)。它是高性能计算和架构领域的顶级会议。 CCF推荐A级会议。 SC每年由ACM和IEEE两个学术组织联合举办。该会议自1988年以来已成功举办24届,是高性能研究领域吸引人数最多、也最受该领域研究人员欢迎的学术会议。近年来,国际高性能领域的最高奖项——戈登·贝尔奖在SC会议上颁发。 SC会议发表难度大,全球每年收到的论文数量只有100篇左右。 2022年投稿320篇,录用75篇(正在修改6篇),录用率25%左右。 SC22将于11月13日至18日在美国达拉斯举行。

AI Lab NLP 火山翻译团队此次提交的作品《LightSeq2: Accelerated Training for Transformer-based Models on GPUs》介绍了目前火山翻译中使用的模型训练系统——LightSeq2。极大优化了目前广泛使用的Transformer模型的训练效率。它在大型公共机器翻译基线(WMT14 英语-德语)上的训练速度比现有系统快308%。

技术介绍

近年来,随着计算机硬件计算能力的提升,越来越多的机器学习和人工智能技术在业界落地。基于Transformer的神经网络机器翻译技术就是最经典的案例之一。

一年后,拥有2k+ 星的代码被批准为SC22。

为了获得高质量的翻译结果,研究人员经常使用更大的神经网络模型,这导致模型训练周期更长,在线推理(翻译)延迟更大。

霍山翻译团队一直致力于这方面的优化。早在2019年12月,其就开源了LightSeq推理加速引擎。业界首个快速、良好的实现,解决了翻译延迟高的问题。

2021年6月,霍山翻译发布新版本LightSeq训练加速引擎。此次团队对整个翻译模型训练流程进行了优化。原本需要三天训练的模型,通过LightSeq 加速,仅需一天即可完成。不仅对于行业来说,它对于GPU 计算能力紧张的研究团队也有很大帮助。

LightSeq此次新增了以下功能:

- 支持Transformer的完全加速

LightSeq是业界第一个完全支持整个Transformer模型加速的训练引擎,包括词嵌入层、编码层、解码层、损失函数层等高效的自定义层。

一年后,拥有2k+ 星的代码被批准为SC22。

- 训练速度快

LightSeq 训练速度非常快。例如,在WMT14英德机器翻译任务上,使用NVIDIA最新的训练显卡A100,LightSeq相比主流序列生成库只需要三分之一的训练时间。

- 功能全面,简单易用

LightSeq提供高效的TensorFlow和PyTorch自定义层供用户灵活使用,并且可以自由插入到Hugging Face等主流训练库中。

此外,它还与当前流行的Fairseq、NeurST等训练库进行了深度集成。安装LightSeq后,用户只需修改几个命令行参数即可在这些训练库上使用LightSeq。

- 提供丰富的二次开发工具

一年后,拥有2k+ 星的代码被批准为SC22。

LightSeq为CUDA内核和Transformer自定义层提供了完整的单元测试功能,可以测试自定义算子的正确性并分析运行时间和加速比,帮助开发者更快地验证功能的正确性和有效性。

LightSeq训练引擎采用算子计算融合、动态内存复用等技术,将训练时间缩短多达三分之一,速度提升3倍以上!

光序列地址:

https://github.com/bytedance/lightseq

此外,我们还开源了Volcano Translation的训练引擎NeurST,深度融合了LightSeq的训练和推理加速。欢迎大家尝试一下。

用户评论

长裙绿衣

哇,2k+ 星的代码竟然被批准为SC22,这真是太厉害了!感觉自己的努力也得到了认可,希望能看到更多这样的成果。

    有13位网友表示赞同!

不识爱人心

看了这个消息,真是激动得不行!2k+ 星的代码,那得有多牛啊!期待这个项目能带来更多创新。

    有6位网友表示赞同!

赋流云

一年后,2k+ 星的代码被批准为SC22,真是实力派!感觉自己的代码水平还差得远呢,要加油学习了。

    有19位网友表示赞同!

矜暮

2k+ 星的代码,竟然成为SC22,这得有多少人认可啊!感觉自己离这样的成就还有很长的路要走。

    有8位网友表示赞同!

执念,爱

看到这个消息,真的很感动。2k+ 星的代码被批准,说明我们的努力没有白费。希望更多的人能加入编程的行列。

    有16位网友表示赞同!

桃洛憬

这个消息太棒了!2k+ 星的代码被批准为SC22,这得有多少心血啊!向作者致敬!

    有5位网友表示赞同!

眉黛如画

一年后,2k+ 星的代码被批准为SC22,这得是何等的荣耀啊!感觉自己的编程之路还有很长。

    有13位网友表示赞同!

回到你身边

2k+ 星的代码,竟然被批准为SC22,这是对编程者的极大鼓舞!希望自己的代码也能有一天获得认可。

    有20位网友表示赞同!

一样剩余

看了这个消息,心里暖暖的。2k+ 星的代码被批准,说明我们的努力得到了回报。继续加油吧!

    有9位网友表示赞同!

青瓷清茶倾城歌

2k+ 星的代码成为SC22,这得有多少人付出心血啊!向所有编程者致敬,你们是最棒的!

    有7位网友表示赞同!

走过海棠暮

一年后,2k+ 星的代码被批准为SC22,感觉自己的代码水平还远远不够。要向作者学习,不断提高自己。

    有16位网友表示赞同!

闷骚闷出味道了

这个消息让人振奋!2k+ 星的代码被批准为SC22,说明编程的价值得到了认可。我们要继续努力,为编程事业贡献力量。

    有6位网友表示赞同!

陌然淺笑

2k+ 星的代码,竟然成为SC22,真是实力派!感觉自己的代码水平还有待提高,要加油了。

    有20位网友表示赞同!

烟雨萌萌

看到这个消息,心里充满了敬佩。2k+ 星的代码被批准,这是对编程者的极大鼓励!继续努力,争取自己的代码也能被认可。

    有6位网友表示赞同!

像从了良

一年后,2k+ 星的代码被批准为SC22,这是对编程者的肯定。希望更多的人能投入到编程事业中。

    有14位网友表示赞同!

开心的笨小孩

2k+ 星的代码成为SC22,这是对编程者的鼓舞。我们要继续努力,不断提高自己的代码水平。

    有10位网友表示赞同!

红尘烟雨

看了这个消息,觉得自己离2k+ 星的代码还有很长的路要走。但是,有了这个目标,我更有动力去学习了。

    有19位网友表示赞同!

哽咽

2k+ 星的代码被批准为SC22,这得有多少心血啊!向作者致敬,希望他的代码能给我们带来更多启示。

    有13位网友表示赞同!

声明:本文由入驻作者编辑撰写,除官方账号外,观点仅代表作者本人,不代表本平台立场,如有侵犯您的知识产权的作品和其它问题,请与我们取得联系,我们会即时修改或删除。

标签

相关新闻

  • 中超联赛争冠组赛制解析

    中超联赛争冠组赛制解析

    1. 什么是中超争冠组赛制?中超联赛争冠组赛制是指在赛季末将排名前六名的球队组成一组,进行一轮单循环的比赛,获胜积分最高的球队将荣膺该赛季的中超冠军。2. 中超争冠组赛制的优点是什么?首先,中超争冠组赛制缩小了争冠球队之......

    2023-09-04 8639
  • 巴塞罗那vs巴黎圣日耳曼6比1回放,巴塞罗那vs巴黎圣日耳曼6比1全场视频

    巴塞罗那vs巴黎圣日耳曼6比1回放,巴塞罗那vs巴黎圣日耳曼6比1全场视频

    1. 赛前阵容分析巴塞罗那和巴黎圣日耳曼各自派出了最强阵容参加这场比赛。巴塞罗那的梅西、苏亚雷斯和内马尔以及巴黎圣日耳曼的博格巴、迪马利亚和卡瓦尼都是顶尖球星,他们的发挥将直接影响比赛。2. 巴塞罗那的控球优势巴塞罗那在......

    2023-09-04 23416