3月11日,国际领先的人工智能数据科技公司星尘AI在北京召开年度春季产品发布会,推出MorningStar。
AI的数据闭环产品。
MorningStar是首个专注于数据价值发现的人工智能数据平台。
与传统数据管理工具相比,这款理念先进、操作简单、功能丰富的AI数据发现、管理、协作、迭代平台,专为发现数据价值而设计。
加速模型迭代,解决AI数据债务问题。
创建可以支撑企业AI数据高效迭代的关键环节,避免数据债务风险累积、低值数据成本浪费、模型训练和应用效果反馈链长等问题。
▲晨星正式发布。
目前,晨星数据管理平台已开放申请。
您可以前往官网查看更多介绍并提交需求。
1.什么是晨星? ▲晨星数据闭环晨星是满足AI 2.0时代数据管理需求的全能工具。
旨在为算法工程师提高非结构化数据管理效率,为公司节省数据资产管理成本和模型在线迭代时间,利用领先的数据生命周期管理、全面的数据挖掘工具、强大的指标跟踪和困难等产品优势。
案例发现能力,高效合规的数据资产管理,远超国内外同类产品,让算法开发更加流畅敏捷,让数据价值得到充分释放。
2.晨星的用户有哪些?通过打造以数据为中心的协作环境,晨星可以消除企业AI数据债务问题,主要服务三类用户:机器学习算法工程师、业务人员和技术经理。
针对不同的用户,晨星可以满足各种需求,涵盖数据硬例发现和模型迭代、指标跟踪等丰富的使用场景;数据价值挖掘、业务效果反馈、运营测试;数据元素管理与企业价值沉淀。
3. 为什么选择晨星?数据技术推动了人工智能的三大变革。
大模型时代,各行各业都需要基于自身数据打造超级员工,提高企业生产效率。
模型和算力可以购买,但数据需要精细化、全流程的管理,才能释放出真正的价值。
企业需要构建可发现、可管理、可协作、可迭代的数据管道,具备获取数据、生产数据、不断迭代数据的能力,推动内部以数据为中心的协作获取AI 2.0时代的数据。
核心竞争力。
晨星是市场上唯一专门为AI 2.0时代企业设计的闭环数据产品。
全面覆盖AI算法从训练到生产的数据管理、迭代、优化、挖掘等闭环环节。
致力于帮助企业建立高效的数据闭环系统,最大化数据价值、优化模型效果,帮助打造差异化竞争壁垒。
▲MorningStar产品优势(1)领先的数据生命周期管理算法工程师可以使用MorningStar管理AI数据生命周期,加强数据版本控制、快速数据切片、可追溯的数据血统和安全控制。
该平台的自动化工作流程确保数据在每个阶段都得到正确的管理和优化。
▲数据切片:灵活的数据切片功能,让算法工程师可以一键选择算法迭代数据方向,进行后续的数据处理过程。
▲数据流:记录包含不同语义信息的版本制作过程数据。
数据流程编排和调度。
算法工程师可以轻松记录数据处理过程和语义结果并进行版本管理,记录全生命周期数据信息,保证数据的可追溯性。
和操作的可重复性。
▲数据流向:数据源和数据标注算法工程师可以利用平台比较模型真值,通过一系列数据追踪、模型调试、分析生成工具发现疑难数据,并一键发送标签到Rosetta数据标注系统点击。
(2)MorningStar,综合数据挖掘工具,支持通过人工监督、语义检索、特征检索等方式,深度挖掘数据价值,包括细粒度可视化、指标计算、数据分布探索、跨模态数据检索等。
生成和数据增强。
,以更低的成本获得最优算法,通过可视化的数据挖掘逻辑帮助用户发现并解决模型训练中的问题。
▲分布可视化 上图显示,晨星利用可视化数据挖掘逻辑发现困难数据和标签分布异常的数据,具有丰富的可扩展性。
▲数据探索算法工程师可以利用晨星进行各种场景、各种维度的数据检索,快速掌握数据情况,制定算法实验思路。
MorningStar支持各类多模态数据可视化和语义检索,可以更轻松、更快速地定向挖掘所需的高价值数据。
(3)强大的指标跟踪和疑难案例发现能力。
作为首个集成疑难案例发现策略的闭环数据产品,晨星可以确保模型训练过程可追踪、可迭代。
通过一系列数据追踪、模型调试和分析生成工具,帮助实现和维护高质量、可重复的AI模型。
▲数据溯源:通过数据流转,用于算法评估的数据可以随时追溯来源。
▲版本对比,通过选择不同的数据版本,实现算法预测结果与真实值的对比,并结合可视化功能,方便定位和分析疑难案例数据。
▲指标跟踪与效果检测晨星利用SDK方便地连接模型训练环境、训练数据分析管理、指标分析环境,方便地进行算法迭代。
(4)高效合规的数据资产管理晨星支持数据集综合分析,协助业务管理者实施企业级数据元管理分析,数据资产规模、内容分布、权属等维度资产信息一目了然。
▲数据合规审核团队可以通过晨星整合数据资产,共享使用价值。
通过权限管理和使用记录,加速部门之间的数据流通,同时保证数据安全。
▲数据资产展示 此外,晨星整合多源、多格式、异构数据,管理超大容量数据,实现企业资产可视化建模;支持多维度细粒度数据的分类盘点,促进对企业内部数据的深入了解,提高企业跨部门协作中的数据流动效率。
上图显示了MorningStar对数据集的流行度值排名。
通过数据使用次数、场景标签、标注结果等评估数据资产对算法迭代的价值,方便对数据元素进行经济效益分析。
(5)更多功能作为一名优秀的算法工程师,你还在用原来的自建工具、临时工具,甚至Excel来处理数据吗?作为专业的AI数据发现、管理、协作、迭代平台,晨星不仅可以让您执行上述高级操作,还拥有丰富的实用功能!例如,支持多源、多格式、异构结构化数据的统一管理;支持SDK,可以进行模型性能评估和监控,并获得全面的模型评估报告。
值得一提的是,星尘数据与香港科技大学合作打造的CIF-Bench自动化评测即将在晨星上线! 28个模型评估列表重点评估20个基本维度,以考察模型在类似任务上遵循指令的能力。
列表链接:需要1天才能发现的困难示例,通过平台只能在1-2小时内找到。
迭代效率大大提高。
未来,晨星将持续进行迭代更新。
欢迎广大用户向我们提供宝贵建议,与我们一起重构数据闭环管理,让AI算法迭代更加高效! 5、晨星正式发布。
星尘数据创始人兼CEO张雷表示:“在AI 2.0时代,掌握自己的数据,就意味着掌握自己的模型。
”企业数据价值的核心在于数据的定义、管理和迭代。
在不断发展的AI技术浪潮中,数据的持续管理、优化和迭代将成为企业在AI2.0时代脱颖而出的关键因素。
如果您的公司希望利用自己的数据和百亿规模的模型来打造自己的超级员工,晨星诚挚邀请您与我们交流。
无论您是哪类有AI数据管理需求的用户,晨星都可以提供全面的解决方案和灵活的使用方式,包括SaaS、企业私有化部署、支持定制化软件开发等。