估值超2亿元!这家珠海企业发布AI算料数据资产包涵盖58个语种

随着人工智能产业高速发展,AI技术迎来快速迭代,市场需求不断释放。而AI赋能千行百业的核心基础,正是语料数据的不断丰富与完善。但在当下,我国语料数据文本量仅占全球1.3%,语料数据发展规模和前景潜力还有无限广阔的空间。

近日,深译信息科技(珠海)有限公司(以下简称“深译科技”)在珠海规划科创中心“模数空间”启用仪式中发布全国首个高价值AI算料数据资产包,它具备多语言、多模态、多领域三大数据亮点,不仅涵盖中、英、俄、葡及“一带一路”小语种等58个语种,呈现文本、语音、图片、视频、3D等8种模态,还覆盖了工业、电商、能源、医疗、医药、文旅等17个领域。

“现在所有大模型出海都面临语言问题,很多大模型厂商都要依托我们这个AI算料数据资产包生成本土化大模型,如葡语大模型、泰语大模型等。”深译科技创始人林余楚告诉记者,“依托我们的数据进行大模型训练和调优,可以助力国内大模型出海实现国际化,让大模型的服务能力更加专业化,形态更加多样化,对AI行业而言也达到了一个质的飞跃。”

作为深圳数据交易所人工智能语料领域的重点合作伙伴,深译科技依托澳门大学、澳门科技大学等澳门高校的科研力量和人才体系,创新打造了自研的数据引擎-深数引擎(Deep Data Engine),构建了闭环数据采标SOP、国际化众包平台、AI标注等生产流程和工具。

深译科技茁壮成长背后,也离不开香洲区丰沃的创新土壤。当前,香洲区大力推动人工智能大模型产业发展,已初步具备从边缘计算AI芯片、数据标注、算力中台、模型底座到垂直行业AI应用的人工智能全产业基础。

随着珠海首个大模型应用高地“模数空间”在香洲区启用,香洲区在推动科技成果转化、培育新经济业态上又迈出了坚实的一步。这一大模型孵化众创空间集技术研发、模型应用、数据交易、算力服务、展示交流为一体,目前已引入大模型36个,入驻项目超20家,计划打造垂类行业应用超100个,未来将为百行千业赋能。

“‘模数空间’可以视为AI生态的一个缩影,具有数据、模型、算力和应用等一系列板块,深译科技入驻后,可以基于自身数据、模型和应用板块,与‘模数空间’的产业链链条进行深度融合,同时也可以链接数据的服务商,进一步服务大模型及应用企业,得到更真实的市场反馈。”林余楚认为,“模数空间”里的企业可以逐步打造成一整个产业生态,形成一个有数据、有模型、有应用又有创意的产业链条,让企业在这片沃土上快速成长。

他告诉记者,聚焦深译科技的数据价值,香洲区一直以来都给予了高度关注和大力扶持,不仅帮助其充分挖掘数据的市场价值、资产价值、资本价值和社会价值,还协助对接深圳数据交易所,完成合规审查、上市入表等工作,“在企业发展过程中也积极帮助我们对接资源,给予人才政策、场地等实实在在的支持,这也是我们这家创业企业能够快速发展的重要因素。”

今年年初,珠海聚焦人工智能、大数据、云计算、低空经济等“关键变量”,提出建设“云上智城”战略构想,致力建设全国首个全市统一、面向未来产业、赋能实体经济科技创新的新型城市基础设施,率先以应用场景开发开放系统推进产业化规模化发展。

在林余楚看来,“云上智城”是未来产业的基础底座,将会托起数千亿级产业集群,聚集更多产业、裂变更多产业机会,引领珠海迈向一个新高度。展望未来,深译科技将把数据、模型、应用板块无缝部署在“云上智城”战略之上,“服务我们AI大模型、AI应用等千行百业,同时立足粤港澳大湾区,结合我们在葡语系及‘一带一路’沿线国家的数据产业优势,助力打造‘云上智城’产业出海的桥头堡。”他表示。

文字:施展华 编辑:冯春雨 责任编辑:应立枫
估值超2亿元!这家珠海企业发布AI算料数据资产包涵盖58个语种
观海融媒 2024-09-12 18:44

随着人工智能产业高速发展,AI技术迎来快速迭代,市场需求不断释放。而AI赋能千行百业的核心基础,正是语料数据的不断丰富与完善。但在当下,我国语料数据文本量仅占全球1.3%,语料数据发展规模和前景潜力还有无限广阔的空间。

近日,深译信息科技(珠海)有限公司(以下简称“深译科技”)在珠海规划科创中心“模数空间”启用仪式中发布全国首个高价值AI算料数据资产包,它具备多语言、多模态、多领域三大数据亮点,不仅涵盖中、英、俄、葡及“一带一路”小语种等58个语种,呈现文本、语音、图片、视频、3D等8种模态,还覆盖了工业、电商、能源、医疗、医药、文旅等17个领域。

“现在所有大模型出海都面临语言问题,很多大模型厂商都要依托我们这个AI算料数据资产包生成本土化大模型,如葡语大模型、泰语大模型等。”深译科技创始人林余楚告诉记者,“依托我们的数据进行大模型训练和调优,可以助力国内大模型出海实现国际化,让大模型的服务能力更加专业化,形态更加多样化,对AI行业而言也达到了一个质的飞跃。”

作为深圳数据交易所人工智能语料领域的重点合作伙伴,深译科技依托澳门大学、澳门科技大学等澳门高校的科研力量和人才体系,创新打造了自研的数据引擎-深数引擎(Deep Data Engine),构建了闭环数据采标SOP、国际化众包平台、AI标注等生产流程和工具。

深译科技茁壮成长背后,也离不开香洲区丰沃的创新土壤。当前,香洲区大力推动人工智能大模型产业发展,已初步具备从边缘计算AI芯片、数据标注、算力中台、模型底座到垂直行业AI应用的人工智能全产业基础。

随着珠海首个大模型应用高地“模数空间”在香洲区启用,香洲区在推动科技成果转化、培育新经济业态上又迈出了坚实的一步。这一大模型孵化众创空间集技术研发、模型应用、数据交易、算力服务、展示交流为一体,目前已引入大模型36个,入驻项目超20家,计划打造垂类行业应用超100个,未来将为百行千业赋能。

“‘模数空间’可以视为AI生态的一个缩影,具有数据、模型、算力和应用等一系列板块,深译科技入驻后,可以基于自身数据、模型和应用板块,与‘模数空间’的产业链链条进行深度融合,同时也可以链接数据的服务商,进一步服务大模型及应用企业,得到更真实的市场反馈。”林余楚认为,“模数空间”里的企业可以逐步打造成一整个产业生态,形成一个有数据、有模型、有应用又有创意的产业链条,让企业在这片沃土上快速成长。

他告诉记者,聚焦深译科技的数据价值,香洲区一直以来都给予了高度关注和大力扶持,不仅帮助其充分挖掘数据的市场价值、资产价值、资本价值和社会价值,还协助对接深圳数据交易所,完成合规审查、上市入表等工作,“在企业发展过程中也积极帮助我们对接资源,给予人才政策、场地等实实在在的支持,这也是我们这家创业企业能够快速发展的重要因素。”

今年年初,珠海聚焦人工智能、大数据、云计算、低空经济等“关键变量”,提出建设“云上智城”战略构想,致力建设全国首个全市统一、面向未来产业、赋能实体经济科技创新的新型城市基础设施,率先以应用场景开发开放系统推进产业化规模化发展。

在林余楚看来,“云上智城”是未来产业的基础底座,将会托起数千亿级产业集群,聚集更多产业、裂变更多产业机会,引领珠海迈向一个新高度。展望未来,深译科技将把数据、模型、应用板块无缝部署在“云上智城”战略之上,“服务我们AI大模型、AI应用等千行百业,同时立足粤港澳大湾区,结合我们在葡语系及‘一带一路’沿线国家的数据产业优势,助力打造‘云上智城’产业出海的桥头堡。”他表示。

文字:施展华 编辑:冯春雨 责任编辑:应立枫