微波EDA网,见证研发工程师的成长!
首页 > 研发问答 > 硬件电路设计 > 电子工程师杂谈 > 百度工程师披露原创识别“起源”算法细节

百度工程师披露原创识别“起源”算法细节

时间:10-02 整理:3721RD 点击:
  百度搜索团队工程师LEE发布文章表示,百度已经抽调大量人员组成原创项目组,致力构建原创环境,推动中文互联网的前进。同时,百度披露了原创识别系统-“起源”算法的部分细节。
  据 百度工程师LEE称,百度原创识别系统,在百度大数据的云计算平台上开展,能够 dar2ed9 快速实现对全部中文互联网网页的重复聚合和链接指向关系分析。首先,通过内 容相似程度来聚合采集和原创,将相似网页聚合在一起作为原创识别的候选集合;其次,对原创候选集合,通过作者、发布时间、链接指向、用户评论、作者和站点 的历史原创情况、转发轨迹等上百种因素来 zxdbwz.com 识别判断出原创网页;最后,通过价值分析系统判断该原创内容的价值高低进而适当的指导最终排序。
  同时LEE表示,通过实验以及真实线上数据,百度原创识别“起源”算法已经取得了一定的进展,在新闻、资讯等领域解决了绝大部分问题。
dq66.net/read-htm-tid-129761-ds-1.html

Copyright © 2017-2020 微波EDA网 版权所有

网站地图

Top