大家好,我是人工智能助手小智,很高兴能与您共同探索人工智能行业的发展。接下来,我将向您介绍深圳语料基地的运作情况。
深圳语料基地由深圳市智慧城市科技发展集团有限公司实体运营,肩负着国家人工智能发展战略的重要使命。在政府部门的监督和指导下,基地承接了国家和深圳市的多项重要语料加工任务。 与此同时,基地还规划通过专业化的市场运营模式,推动人工智能产业的发展。 希望通过这次介绍,能够让您加深对深圳语料基地的了解。
深圳语料基地通过在算力供应、平台研发、团队建设、可信空间、制度规范和指导监督等六个方面的积极努力,构建了一整套体系化运营模式,聚合并高效服务于深圳语料联盟的各类机构,推动人工智能产业的发展。
深圳市政府对语料基地的建设高度重视,规划建设坂田基地、河套基地和福田基地,从算力、语料和算法三个维度大力推动产业的高质量发展。深智城集团作为全市唯一法定授权数字底座建设运营单位,依托语料基地建立了深圳语料联盟,有序推动语料供给单位、治理单位和应用单位之间的交流与合作。
为开展高质量、高效率的语料加工,基地通过持续研发与迭代,打造了语料工程平台,可提供多模态数据的汇聚、清洗、解析、算法策略管理、加工标注、质量管理以及团队项目管理等多项功能。目前,平台已具备69类智能算子,对文本和视频的转化成功率高达95%以上。
除了数据加密传输、脱敏等基础安全措施之外,平台强化打造了基于对象、行为、时间、环境的23项安全控制策略,保障数据安全存储、流通和应用。
为保障长期稳定运作,联合联盟单位共同建设了语料基地的运营管理机制,涵盖供需对接、数据汇聚、数据加工、数据质检、数据运营和安全合规等核心模块,为标准化的高质量语料生产保驾护航。
语料加工和模型训练均离不开充沛的算力支撑。在国家战略的牵引下,现已布局建设深圳开放智算中心。中心拥有高密度的英伟达服务器集群,是目前广东最大的基于Hopper架构的高密度智能算力集群之一。 中心已通过专线联通政务网,并通过物理隔离和逻辑隔离的方式建立了安全可信专区。同时,还通过多方面的安全管理措施,保障数据不出域,满足合规要求,让用户无后顾之忧。 更为重要的是,平台可以提供底层算力调优、并行训练、模型研发和算法研发等多方面的专家服务支持,助力用户全身心投入到场景应用的建设中。
语料基地团队建设依托于深智城集团强大的人才资源,已成立了数据工程、算法工程、系统工程和安全合规四支团队。同时,基地与行业内多家知名企业建立了战略合作伙伴关系,促进企业科研成果在各行各业中为用户创造价值。
深圳语料基地的当前工作进展如下:已邀请67家单位加入语料联盟,开发了69类算子和23项安全策略,正在加工2200TB的政务语料。平台已发布461TB的语料产品,语料质量获得用户的高度认可。
深圳语料基地致力于为用户提供涵盖语料、算法和算力的全方位端到端服务。这些服务包括语料供应、数据源拓展、语料加工、模型训练、检索增强工程、提示词工程以及算力运营服务。
诚挚邀请各行业单位加入深圳语料基地的建设工作中来,携手共同推动人工智能行业的快速发展,享受行业发展带来的红利。感谢您的观看,如有需求,请随时与我们联系,热忱欢迎您的加入。