高棉语融入人工智能
柬埔寨和新加坡昨天签署了一项具有里程碑意义的备忘录,通过人工智能增强高棉语言模型,这是东南亚人工智能发展的重要一步。
该谅解备忘录(MoU)由柬埔寨人工智能论坛主席 Chhem Siriwat 和新加坡国家人工智能发展计划 AI Singapore 的战略、合作和增长主管 Darius Liu 在柬埔寨科技大学(CamTech University)签署。
备忘录是在新加坡人工智能项目“东南亚语言是一个网络”(Sea-Lion)下签署的,该项目是一系列开源大型语言模型(LLM),可以更好地了解东南亚(SEA)的多元背景、语言和文化。
项目以新加坡人工智能产品支柱为基础,旨在创建针对东南亚地区代表性不足的人口群体和资源匮乏的语言的法学硕士学位。
Siriwat 在开幕致辞中强调了该备忘录对于实施该项目以及创建高棉法学硕士学位对柬埔寨未来人工智能发展的重要意义。
他指出:“我们聚集在一起不仅是为了正式确立合作伙伴关系,也是为了庆祝柬埔寨人工智能论坛和新加坡人工智能之间的合作精神和共同愿景。”“这次合作是实现 Sea-Lion 项目的关键一步,双方将共同努力推动高棉法学硕士项目的实施,为柬埔寨在人工智能领域的未来发展做出贡献。”
“我们共同站在古老遗产与尖端技术的交汇处,我们的共同努力将为跨世代的创新和机遇打开大门。此次合作体现了区域合作的价值,通过 Sea-Lion 项目,我们拥抱了开放式教育的概念,这是一种构建人工智能的协作方法,让每个人都能从研究人员、企业家到教育工作者受益。”他表示,高棉语言不仅仅是一种交流的手段,它还是一个文明的韧性和创造力的活生生的见证,这个文明为世界带来了宏伟的吴哥帝国。
通过开发高棉语法学硕士学位,Siriwat 强调该项目有可能突破语言和数字设备,增强当地社区的能力,并使柬埔寨成为全球人工智能领域的贡献者。
人工智能新加坡基础模型应用研究 (ARF) 负责人 William Tjhi 表示。该项目协议的第一阶段将重点关注问卷调查和数据收集。“就高棉语而言,基础本身还不足以让我们执行指令,因此我们需要提高人工智能的基础能力,并且需要媒体的帮助来增加原始高棉语数据量。 我们探索了另一种想法,即获取 PDF 数据,然后将其翻译成文本,以及获取语音和声音数据以转录成文本。”