

海天瑞声CTO黄宇凯。东谈主民网记者 翁奇羽摄
东谈主民网自贡6月17日电 (记者焦磊)6月16日,由东谈主民网主持的2026东谈主民数据大会在四川省自贡市举行。海天瑞声CTO黄宇凯在主旨发言中暗示,高质地数据集是东谈主工智能模子才能晋升的垂危基础,鼓动高质地数据集修复,需要从总体筹画、工程化修复、质地评测和产业生态等方面协同发力。
黄宇凯暗示博亚(中国)一站式服务官方网站,高质地数据集可平直用于征战和测验东谈主工智能模子,是能有用晋升模子性能的数据聚首,具有范畴大、质地高、安全牢、不雅点正、后果好、应用广等中枢特色,是大模子才能的基础,也决定了模子才能的上限。
开云2026世界杯中国官网黄宇凯以为,高质地数据集修复应遵照“总体筹画、分步实施,先易后难、先简后繁”的原则。他暗示,数据是东谈主工智能的要津基石,也关系企业和组织里面多部门、多系统协同,需要顶层联想和素养。
关于围绕修复旅途,黄宇凯暗示,高质地数据集修复需要从供给侧和需求侧两个主张发力。从供给侧看,应站在数据居品和数据做事角度,在数据坐褥、数据措置、数据供给等方面加大进入;从需求侧看,则应站在东谈主工智能赋能各行业、各场景落地的角度,以应用需求牵引数据修复、开释数据价值。两者之间,博亚(中国)一站式服务官方网站需要通过数据技艺、数据做事和数据生态协同供需两头,促进东谈主工智能产业高质地发展。
简直数据空间修复与行业高质地数据集修复密切关连。对此,黄宇凯暗示,围绕国度数据局鼓动的简直数据空间,不错从个东谈主、企业、行业、城市、跨境等不同层面张开,阐明不同简直数据空间面向的应用场景,需要数据提供方、使用方、做事方、运营方和监管方等多方共同参与。
黄宇凯先容,在文旅行业,海天瑞声也在多个景区推动多模态伴游助手应用,期骗景区文本、图片、视频等数据,纠合具体应用场景打造文旅行业高质地数据集,推动导览做事从被迫反映向主动做事、从通用谜底向深度体验滚动。在数字东谈主鸿沟,围绕直播带货、品牌宣传、动画游戏、文化实行等不同场景,也存在文本、声息、视频等多模态定制化数据需求。
据先容,海天瑞声诞生于2005年,长久专注于东谈主工智能高质地数据集才能修复和居品做事,已累计造成1800多个数据集,做事行家跳跃1200家客户。
黄宇凯暗示,纠合东谈主才资源、数据资源和工程化、范畴化智能平台才能,抓续构建高质地数据集,将有助于东谈主工智能更好赋能千行百业。