标书查重算法及使用技巧

标书查重是用来辅助判断围标串标行为的重要手段,一个好的标书查重系统需要拥有优化过的查重算法。

比如一个场景,投标文件中会大量复制招标文件中的一些技术和商务条款,

这就导致比对的标书中存在大量重复,相似度很高。这种情况,重复是合理的,造成的高相似度不能判定为围标串标。

好的查重系统需要能够过滤上述场景中的内容,也就是白名单过滤功能。将招标文件作为白名单,投标文件中和白名单相同的内容,在对比之前先进行过滤,

这些能够避免造成不合理的高相似度,防止误导评审人员判断围标串标。

过滤掉干扰因素后,标书查重的相似度才有参考性。相似度单个看意义不大,多个相似度一起看才能发现问题。一批投标书,大家的相似度都是20%左右,

而有两份投标书相似度是40%,那么这两篇标书就应该重点查看,打开对比详情,检查到底是哪些内容相似,相似的地方合不合理,经过人工审查判断后,最终才能做出围标串标的判断。

实际操作过程中,也是根据相似度从高到低的查看,高相似度重点检查,低相似度的根据时间可以放宽检查对比。

标书查重系统可以利用计算机的强大算力,在短时间完成大量文字的对比工作,帮助人节省大量时间,辅助评审人员判断是否有围标串标行为。

Tocheck致力于研究开发文本相似度检测技术,为企事业单位提供标书查重,项目申报/专利查重,员工论文查重,企业信息资产安全保护等多项服务。


2022-12-29 17:07:51

相关文章

破局招投标沉疴:综合施策的系统解决方案 破除招投标领域制度滞后与交易壁垒 破网打伞,纪检监察重塑招投标清朗生态 创新评标办法,优化招投标环境 招投标中的供应商风险评估与采购应对策略 中小企业如何撕开围标铁幕? 提案筑基筑牢招投标规范发展四梁八柱