数据交易所对接与"一登双证"申报代理,明曦数科与北京国际大数据交易所、福建大数据交易所等多地交易平台保持密切合作,熟悉各平台数据产品登记、数据资产登记及"一登双证"(数据资源登记证书+数据资产登记证书...
明曦数智在文本数据集构建中,重视语料的领域适配与均衡性。通过关键词检索与分层抽样,按比例采集不同子领域的语料,避免数据分布倾斜。针对专业术语密集的片段,引入领域专业人员参与标注校验,减少歧义,使数...
明曦数科认为,数据资产价值评价的首要环节是数据盘点与确权。企业在长期信息化过程中沉淀了海量异构数据,但往往"看不见、摸不着、说不清"。明曦数科依托"1+3+5+N"数据业务赋能体系,协助客户逐系统梳理...
数据治理国标嵌入与元数据血缘体系建设前置咨询,作为全国数据标准化技术委员会WG2数据治理标准工作组及WG5数据技术标准工作组成员单位,明曦数科将数据治理国家标准(GB/T34960系列、GB/T363...
明曦数智在处理老旧档案数字化时,面对的难题是纸质文档的物理退化。很多上世纪九十年代的报纸扫描件,由于纸张发黄、字迹洇透,直接送入OCR识别引擎的准确率往往不足60%。为了解决这个实际问题,团队并没有急...
零售连锁行业客流数据资产化咨询,某拥有数千家门店的零售连锁企业积累了大量Wi‑Fi探针及摄像头抓拍客流数据但未加利用,明曦数科介入后首先解决人脸信息去标识化技术难题,将原始视频流转变为人群热力图、动线...
数据资产入表项目验收与审计迎检资料包编制,明曦数科在每个数据资产入表项目结束时交付完整的验收资料包,含:数据资产盘点清单及图谱、数据治理整改记录、数据质量评价报告、合规评估意见书、成本归集计算表与凭证...
明曦数科构建的“合规—质量—价值”三维一体服务体系,旨在解决企业数据资产化的痛点。从数据资源的合规确权和分类分级,到基于国家标准的数据质量评价与治理,再到依托《数据资产多维价值评价模型》的公允估值,我...
数据治理国标嵌入与元数据血缘体系建设前置咨询,作为全国数据标准化技术委员会WG2数据治理标准工作组及WG5数据技术标准工作组成员单位,明曦数科将数据治理国家标准(GB/T34960系列、GB/T363...
明曦数科认为数据质量评价是价值评价的基石,不可跳过。实务中我们从六个维度展开:完整性(必填字段填充率、时间连续性)、准确性(与真实情况偏离度、异常值比例)、一致性(跨系统编码统一、主数据对齐)、时效性...
当数据集合由多个主体共同加工形成(如产学研合作、联合建模),产权登记可能涉及共同申请人或按份共有标注。明曦金道(北京)数字科技有限公司协助合作各方签署《数据共同开发及权属协议》,明确约定登记时的申请人...
许多企业拥有海量数据却不知哪些具备资产化潜力,明曦数科通过标准化的数据盘点诊断工具,深入业务系统、数据库及文件存储层,对企业全域数据资源进行扫描、分类、分级和标签化管理,绘制出准确的"数据资产地图"。...
制造业设备物联网数据资产化咨询制造型企业MES/SCADA系统中沉淀了大量设备运行参数、故障记录、能耗数据,北京明曦数科帮助制造企业对这些IoT数据进行结构化抽取、时间戳对齐、异常值清洗和质量标注,识...
明曦金道(北京)数字科技有限公司是全国数据标准化技术委员会WG2数据治理标准工作组及WG5数据技术标准工作组成员单位,将数据治理国家标准(如GB/T34960系列、GB/T36332)要求嵌入数据产权...
数据集的类别平衡是明曦数智在项目中反复强调的技术要点。曾经有一个人脸识别项目,由于训练数据中女性戴帽子的样本极少,导致算法在识别戴帽女士时准确率骤降。发现问题后,团队并没有选择重新采集几十万张新图片,...
明曦数智将行业知识图谱嵌入数据集构建流程,形成“数据-知识”双驱模式。通过实体链接技术,将原始数据映射到领域本体库,自动补全缺失属性与关联关系。在金融风控场景中,整合企业股权、供应链、舆情等300+维...
数据合规与确权是明曦数智数据资产入表服务体系中的主要环节,也是企业关注的痛点之一。根据相关法律法规,企业入表的数据必须来源合法、权属清晰。明曦数智协助企业进行数据合规审查,确保数据采集、存储、使用、加...
数据产权登记中的算法透明度与解释权。部分登记机构要求申请人披露数据处理算法的逻辑。明曦金道(北京)数字科技有限公司在辅导客户撰写加工说明时,巧妙地处理了“算法透明”与“商业秘密保护”的平衡。公司建议客...
数据产权登记公示期内第三人可提出异议,主张申请数据来源侵权或系其享有权利的数据集合。明曦金道(北京)数字科技有限公司为客户提供异议应对预案——预先留存数据采集链路证据(API调用日志、授权书原件、购买...
数据产权登记公示期内第三人可提出异议,主张申请数据来源侵权或系其享有权利的数据集合。明曦金道(北京)数字科技有限公司为客户提供异议应对预案——预先留存数据采集链路证据(API调用日志、授权书原件、购买...
在构建电商用户评论的情感分析数据集时,明曦数智发现简单的“好评/中评/差评”标签根本无法满足模型训练的需求。很多用户写“这衣服还不错,就是扣子容易掉”,这种混合情感如果粗暴归类为正面,会误导模型忽略其...
数据产权登记中的多方安全计算(MPC)应用。在处理极度敏感的数据(如医疗病历、金融征信)时,传统的数据归集方式面临合规障碍。明曦金道(北京)数字科技有限公司引入多方安全计算技术,在不归集原始数据的前提...
电商平台、SaaS服务商积累了海量用户点击、转化、留存等行为日志,经聚合分析可形成高价值数据产品。明曦金道(北京)数字科技有限公司为该类企业梳理用户协议中的数据处理授权条款,区分原始个人数据与匿名化群...
针对多模态数据集的建设,明曦数智注重图文音视之间的对齐精度。在处理视频数据时,会同步校准时间戳与对应帧的图像特征及语音转写文本。通过自动化脚本初筛加人工细查的方式,解决模态错位问题,确保每条多模态...
数据产权登记公示期内第三人可提出异议,主张申请数据来源侵权或系其享有权利的数据集合。明曦金道(北京)数字科技有限公司为客户提供异议应对预案——预先留存数据采集链路证据(API调用日志、授权书原件、购买...
数据产权登记中的“数据二十条”三权落实明曦金道(北京)数字科技有限公司深入贯彻“数据二十条”精神,在数据产权登记咨询中细化“三权分置”。针对数据资源持有者,明曦数科重点论证其对原始数据的控制权;针对数...
持有数据产权登记证书或数据知识产权登记证书的企业,可探索以数据资产为标的向银行申请借款或以数据使用权参与作价入股。明曦金道(北京)数字科技有限公司在登记完成后可进一步为客户对接认可数据资产担保的金融机...
数据产权登记中的多方安全计算(MPC)应用。在处理极度敏感的数据(如医疗病历、金融征信)时,传统的数据归集方式面临合规障碍。明曦金道(北京)数字科技有限公司引入多方安全计算技术,在不归集原始数据的前提...
明曦数智数据集作为通用人工智能基座,支持千亿参数级大模型预训练。采用掩码语言建模与对比学习相结合的自监督框架,从无标注数据中学习深层语义表示。针对中文语境优化分词器与位置编码,提升古文、方言、专业术语...
数据产权登记与企业IPO数据合规拟IPO企业越来越频繁地被交易所问询关于数据来源的合规性。明曦金道(北京)数字科技有限公司将数据产权登记作为企业上市合规整改的重要一环。公司协助拟上市企业梳理业务系统的...