中意知识网 中意知识网

当前位置: 首页 » 常用知识 »

全球22个交付中心!东莞闯出AI数据黑马

当全球科技巨头聚焦AI算法突破时,一家来自松山湖的企业正以“数据基建者”之姿,悄然“铺设”人工智能的核心底座。

近期,在东莞市工信局与松山湖管委会组织的产业交流活动中,活树信息科技(东莞)有限公司(下称“活树科技”)与软通动力、银雁科技、中软国际等松山湖企业展开深入合作探讨,共同探索构建“数据驱动、算法协同、本地应用”三位一体的新型智能制造生态,引来各方关注。

从AI大模型的精准回应,到自动驾驶的灵敏反应;从翻译软件的准确输出,到语音助手的自然对话——每一次技术的跃迁背后,活树科技都是那个低调却不可或缺的“推手”,深耕数据服务逾20年,早已成为AI数据领域的“隐形巨头”。

在科技创新企业“高手林立”的松山湖,活树科技俨然是一匹战力十足的“黑马”。从松山湖起步,到走向全球,其正成为推动AI走向多语言、多文化世界的重要幕后力量。

业内“元老”实现蝶变

“数据厨房”提供精准服务

算法、算力与数据,构成AI发展的“三驾马车”。成立于2004年,活树科技扎根于人工智能基础数据服务领域,已成为同行业内当之无愧的“元老”。

从最初的文档数字化处理,蝶变为如今覆盖全球、服务超百家头部科技企业的AI数据服务商,活树科技的服务范围涵盖大语言模型训练、无人驾驶、多模态内容审核等前沿AI场景。目前,公司在全球设有22个交付中心,拥有超3.4万名数据标注工程师,构建起覆盖100余种语言的“数据神经网络”,为微软、谷歌、百度、腾讯、科大讯飞等百余家头部客户持续提供高质量的数据支撑。

“以微信语音识别为例,其能精准识别多种口音与方言,背后离不开成千上万小时的语音数据标注训练。”该公司商务总监戚思慧表示,“我们的核心任务,是在AI算法之前,为其打下数据基础。”

戚思慧形象地将公司的服务比喻为“数据厨房”:“客户拿着‘菜谱’——也就是算法模型,来到我们这里定制‘菜肴’。而我们要提供匹配的‘食材、佐料和火候’,即多维度、高质量的数据。”

在AI数据服务行业,谁能更早、更深地理解客户需求,谁就能掌握竞争先机。对此,活树科技给出的答案是“前置化服务”。

“不只是数据采集层面的响应,而是提前介入客户的算法逻辑与应用场景,帮助其精准定义所需的数据类型与质量标准。”戚思慧表示,公司在项目初期即组建了“知识管理团队”,深入对接客户算法部门,从需求建模阶段便开始参与方案设计,像“数据医生”一样去诊断开方,找到问题源头,提供精准、有效的数据解决方案。

这种前置化策略,也让活树在大模型训练、语音识别、多语言自然语言处理等关键AI应用场景中,拥有更强的客户黏性和算法适配力。尤其在多语种数据处理方面,活树科技是业内少数具备100+语言服务能力的企业。在中文方言、小语种和跨语言语料处理等复杂场景中,凭借稳定的交付效率与标注精度,活树科技的服务已成为语音识别、机器翻译、语音合成等应用中的标杆。

从“啃硬骨头”到全球交付

打造AI时代的数据“护城河”

近年来,随着全球客户对多语种AI模型的需求持续增长,活树科技不断拓展本地服务触点,优化交付网络,加速国际化进程。

日前走进活树科技的运营中心,墙上的大屏实时显示着全球各地数据采集项目的进度。从东南亚、到中东、再到欧美,分布在多个时区的数据交付团队正在并行作业——这是一个为AI系统提供训练“燃料”的幕后网络。

为支撑跨时区、跨文化背景下的全球采集任务,活树科技在全球各地设有数据交付团队,以确保跨境数据流通的稳定与高效。

如今,在全球AI行业谈及“非通用语种数据处理”,活树科技已然是被频繁提及的行业方案提供者。2024年,活树科技实现营收约1.2亿元,并计划在2025年持续扩大海外市场布局。

目前,公司已在东南亚、中东、非洲、拉美等新兴市场建立起本地化的采集与标注能力,构建起多语种数据生态,成为众多国际客户拓展全球模型的重要合作伙伴。

活树科技在非洲贝宁科托努的数据交付中心

“我们的核心竞争力,在于‘标准化流程’与‘定制化需求’的高效协同。”戚思慧介绍,依托自研的数据工作流程平台,活树科技已经实现从数据采集、清洗到标注的工业化闭环,建立起“全球特许经营网络+工业化流程+平台化运营”的三大能力体系,大幅提升交付效率,更保证数据质量的精度与一致性。

事实上,早在2008年,活树科技便设立了东南亚数据基地,是国内较早走出国门的AI数据企业之一。

“当年在为中国最大的音乐平台出海提供数据服务时,我们的团队要处理泰语声调、马来语的黏着结构……每一项都是难啃的‘硬骨头’,但也正是这些挑战,锤炼了我们在多语言数据处理方面的能力。”戚思慧回忆道。

如今,这一优势成为活树科技AI数据服务出海的重要支撑。随着中国智能驾驶产业加速全球布局,欧美及中东市场对高质量训练数据的需求激增。活树科技凭借全球化的数据交付基地、本地语言团队和供应链体系,助力车企在海外完成数据标注与产品落地,构建起“全球采集、本地优化、跨境交付”的服务模式。

比如在执行层面,以车载智能座舱为例,语音识别系统需要覆盖不同语言、口音、噪声环境等。活树科技通过线上众包团队与线下采集网络的协同作业,在目标国家完成语音朗读、自由对话、场景模拟等任务,确保训练样本贴近真实使用场景。

“有些项目要求非常具体,比如客户指定要在某款车型、特定设备下采集语音数据,而且必须在海外的道路和网络环境中完成。”戚思慧说,“我们甚至曾把整辆车从中国运往海外,只为确保采集条件与实际使用环境完全一致。”

从幕后走向台前

携手制造业探索AI新生态

今年3月,东莞市人工智能大模型中心宣布开服,这是全国首个面向制造领域的城市级大模型中心正式落地东莞。大模型中心计划2025年打造50个以上AI+先进制造示范应用场景,力争到2027年打造135个以上AI+先进制造示范应用场景。

当人工智能从实验室走向商业落地,数据质量与团队能力逐渐成为AI产业链中最不可或缺的底层支撑。活树科技正通过全球化人才体系和本地化产业融合,悄然成为AI时代的“领跑者”。

围绕全球市场布局,活树科技持续强化多语种、多文化背景下的人才体系建设。目前,公司已在马来西亚等地组建跨语言团队,不少成员同时掌握4至5种语言,高效协作于国际项目及跨境数据交付工作中。

与此同时,活树也在东莞松山湖光大We谷等地建立本地化招聘与培训基地,打造AI数据人才“实训营”。新员工在国内完成基础培训后,陆续被派往美国、法国、爱尔兰等地,参与实战项目,并接受跨文化能力的系统锻造,形成“人才输出 + 知识迁移”的双向成长路径。

“这种高强度的人才培养方式成本并不低,但我们坚持认为,人才是AI企业的核心资产。”戚思慧表示,只有系统化构建从评估、培训到实战的完整链条,企业才能承接全球客户不断提升的数据需求和算法协同能力。

随着年初deepseek迅速走红,众多工业服务商和制造企业纷纷接入人工智能大模型,工业AI市场迎来新变局。这也使得AI产业对高质量训练数据的需求加速膨胀。在这场变革中,像活树科技这样的“幕后玩家”正在一步步走向前台,助力AI从“能用”走向“好用”。

在服务全球顶尖大模型公司与科技巨头之外,活树科技也在本土积极探索“AI+制造”融合创新路径。自2015年起,公司同步将战略重心转向国内市场,并将总部迁至东莞松山湖,深耕本地九年,逐步搭建产业化落地能力。

东莞松山湖

近年来,东莞松山湖全力打好科技、产业、城市、人才“四张牌”,加速聚集各类要素、汇聚各项政策、凝聚各方力量,为企业发展打造了良好商业氛围和营商环境。而以松山湖为新起点,活树科技正尝试携手本地制造企业,在工业自动化、智能质检、产线优化等核心场景展开合作,将自身的数据能力与算法理解力嵌入传统制造链条,助力产业数字化转型升级。

戚思慧表示,东莞松山湖科技生态优越,坐落于广深港“黄金腹地”,拥有华为、腾讯云等龙头科技企业,是数据企业发展的理想土壤。近年来,松山湖开发者村等平台也积极与企业展开合作交流,为技术研发和业务拓展提供持续助力。

撰文:郑文怡 朱晋

图片:受访者供图 黄政正

统筹:郭文君

【作者】 郑文怡;朱晋;黄政正

【来源】 南方报业传媒集团南方+客户端

未经允许不得转载: 中意知识网 » 全球22个交付中心!东莞闯出AI数据黑马