新闻中心_云新融数科

机器学习

人机识别

在反消费信贷套现欺诈过程中，利用生物探针采集的移动端界面传感器数据，进行人机识别。通过获取数据并观察其统计特征及分布，结合业务规则和数据的分布建立深度学习模型。测试集双指标95%以上的前提下，在保证验证集（抽取实际样本验证）机器数据召回率 72%，人的数据误识率1%的情况下，能够基本稳定的拦截线上数据的日均千分之五（记录数）。

图神经网络

知识网络通常表示为异构图，其中不同的关系由不同类型的边表示。图神经网络可以浓缩图中的节点信息，生成节点嵌入，作为机器学习模型的输入。在营销反欺诈任务中，利用用户间多种关系（注册表/绑卡/实名认证等）生成异构图，达到甚至超越有监督学习模型的性能。

深度学习

这项创新深度学习优化算法，从根本上解决了深度学习算法的计算速度瓶颈问题，提出了新颖的深度学习分布式优化理论和算法——特征回放算法（Features Replay），通过实验验证了无性能损失的前提下，特征回放算法比传统反向传播算法（Back Propagation）在速率上节省至少34.4%，应用该技术成果将加速深度学习模型的训练计算，提升效能。

联邦学习

目前，所有联邦学习都是同步的。因为不同服务器的计算能力、计算速度有差别，所以同步的联邦学习不能解决多方的联合建模问题，进而需要异步计算。将联邦学习技术应用于风控联合建模，解决隐私数据安全共享问题，改变数据孤岛条件下无法实现的业务效果。目前已经整合区块链、容器技术、联邦学习构建行业级的联合建模解决方案。

计算机视觉

人脸识别

结合学术界最先进的人脸识别技术和工业界的实际业务情况，搭建了多场景联合训练+跨场景对抗训练的人脸识别训练框架，基于该框架可以在少量的标注数据的情况下训练出同时具备业界领先准确率和跨场景识别能力的人脸识别模型，极大的降低了人脸识别技术在实际业务场景的落地成本。同时基于业界领先模型压缩和量化技术，可以把人脸识别模型压缩到1M左右，在移动端和边缘端对视频中人脸进行实时识别的同时可以把风险控制在千万分之一误识率。

人脸防伪

团队在工业界3D技术日益成熟的背景下与中科院一起合作，建立人脸防伪领域第一个多模态人脸防伪的数据集，并且相关论文被国际顶级会议CVPR接受发表，为多模态人脸防伪技术的发展建立标准。同时京东数科视觉团队基于京东自己核心业务每天数百万次的调用，以及外部公司银行各种场景中出现的人脸攻击方式，训练业界领先的人脸防伪技术，可以有效抵御3D打印、视频、图片、面具、头套等各种人脸攻击，准确率达到了金融级别的安全标准，并在公司内部核心业务和外部技术输出中得到应用。

文字识别

针对如银行卡，身份证，发票，电子汇兑票，营业执照，自然场景等多个场景，利用深度学习从扫描件，拍照，影印等照片中识别文字内容，或者结构化数据。用于图像矫正、文本检测、文本识别、版面分析图谱定量分析。支持识别增值税发票、银行电子汇兑票、营业执照、身份证、银行卡等所有品类的结构化票据；票据、卡证类别形态各异，背景复杂，光线不一的前提下，具备非常高的可用性；无论是高拍仪、普通摄像头、扫描仪、手机、对屏翻拍等，均可以实现识别；利用前沿的深度学习技术进行敏捷开发，票据、卡证、通用等实际场景识别准确率在97%以上；公司的文字识别服务每天提供上亿次服务调用。为了降低服务的延时，针对各个模型的推理过程进行大量的优化。灵活性强，可多种类型组合搭配部署，有丰富的跨国、跨公司部署经验；支持中，英，繁，泰。基于事理分析和采用统计学习方法，对图谱建立定量因果推理，从而更为准确的预测未来的发展趋势。

语音学习

语音合成

真人声调：基于Tacotron2的深度神经网络对字音进行建模，发音自然流畅，并且模拟了人的呼吸和停顿，听感酷似真人;
风格可控：使用VAE进行多说话人的个性化建模，对说话人音色和风格进行精准编码，可以合成出不同音色和说话风格的音频；
实时生成：采用Waveglow神经网络声码器提升合成速度近百倍，支持多场景的实时生成。

文本合成

相似问法生成：增强语义理解，提升应答精度；
自动FAQ生成：挖掘文本知识，提升问答覆盖率；
资管日报生成：打通数据通道，提升自动化效率；
短文章生成：拓展资讯容量，提升社区活跃度

语音识别

语音识别技术已实现端到端的语音识别，无需预训练和强制对齐，技术采用注意力机制，有效提取长语音序列特征，可快速解码，一秒钟可识别8秒音频。目前，语音识别技术经过海量训练数据，运用多种数据增强手段，多场景定制化语言模型，确保模型的泛化能力。如今，京东数科语音识别技术在多个公开测试集识别率超过95%，在自有客服场景识别率超过93%，同时还具备端点检测、说话人转换检测、说话人角色识别等功能。

知识图谱

可实现信息和数据的可视化，将信息与数据形成图谱以便用户进行查询，并自动生成智能问答。该项目在业内首次实现了知识图谱技术和行业专家知识（产业链人工图）的深度融合。用户不仅能够直观地从产业链图看到其上下游结构，还可对产业链图根据自身理解进行自定义配置，并与知识图谱数据库进行关联。京东数科的知识图谱技术已在资管科技平台JT²平台正式上线，同时服务于京东金融App，支持各个业务线的销售对话机器人，包括白条，金条，小金库，基金等业务，为智能问答系统提供了推理问答，逻辑判断问答，查询问答等功能。