天极大咖秀

登录 | 申请注册

从暴力穷举到智能导航,PC本地搜索被腾讯电脑管家“拯救”

智能相对论 2025-07-03 阅读: 2,412 次

文 | 智能相对论

作者 | 叶远风

在文件资源管理器地址栏输入关键词,按下回车后,系统开始了漫长的扫描过程,硬盘被“仔仔细细”一个个文件进行比照,然后慢吞吞把结果展示出来,只能等待,着急又无可奈何……

这是很多人使用PC端本地搜索时面临的常态。

这肯定是不正常的,但长久以来,从操作系统厂商,到应用开发者,再到千千万万的普通用户,都这么“凑合”地过着。

现在,有人站出来想要解决这个问题。

最近,腾讯电脑管家升级了本地搜索的新功能,试图帮助PC端的用户更好地进行本地搜索——这个“不起眼”而又是打工人频繁接触的地方,终于有人开始关心起来。

PC本地搜索“剪刀差”越来越大,却深陷“技术漠视”

当前,PC本地搜索实质上形成了一个能力与需求的“剪刀差”,且有不断增大的趋势:

一边,是很多用户的PC配置并没有想象的高,例如Win 11已经面世多年,但Win10仍然占据着主要的市场份额,占比接近7成,这其中旧款电脑预装win10没有进行升级是主要原因;

另一边,全面数字化时代,普通用户日常工作生活积累的数据量变得越来越大(日积月累的文档、越来越高清的照片等等),本地搜索对电脑性能的压力又变得越来越大。

这就需要一个产品,能够在满足需求的同时契合大部分用户的硬件能力。然而,大环境上来看,整个PC应用发展所面临令人无奈的“技术漠视”现象,也即,明明已经有很多人看到了问题但没有人去采取行动解决(个中原因说来话长,但客观结果已经注定),过去并没有人来做这样一件事。

在手机这些移动终端上,一旦出现卡顿、体验差,操作系统厂商、应用厂商们会想方设法优化、提升,并适应尽可能多的机器型号。而在PC上,出现包括搜索在内的体验问题,很多人第一反应是:怎么不去换个新电脑,提高一下配置(如装高速固态硬盘)?而没有人去质问:为何都2025年了,到处都是“用户至上”的理念,PC端却还在逼着用户去改变?

对本地搜索的慢、卡,业界似乎已经“集体麻木”。

正是这个时候,腾讯电脑管家站了出来。

告别暴力穷举、迈向智能导航,PC本地搜索体验再进化

腾讯电脑管家在做的,就是用技术创新消弭“剪刀差”,让更多PC端用户能够很好地利用本地搜索实现自己的检索需求。

这首先表现在有限资源下实现资源效率最大化。

腾讯电脑管家的本地搜索是基于NTFS文件系统,直接解析NTFS文件系统中的主文件表(MFT)(这是一个完整记录了本地所有文件的基础信息的隐藏文件),获取包括文件名、大小、修改时间等元数据。

传统操作系统搜索采用的是递归遍历磁盘方式,通俗说就如同查户口一家一家去敲门、找到了才算。而腾讯电脑管家的方式,是直接读取硬盘系统(NTFS)内部记录所有文件信息的“总户口本”(MFT),瞬间知道所有文件在哪、叫啥名。

这是一种底层解析方式,能够大幅提升索引的速度和准确性,同时降低系统资源消耗。

这种方式,也附带解决了文件实时变更感知的问题。

在传统搜索中,如果文件发生了删改,则需要过一段时间或者下次全盘扫才能发现,即时性、准确性不足。而腾讯电脑管家充分利用了NTFS的UsnJrnl(文件变更日志)实现对文件增删改等操作的实时感知,能够实时捕获增删改事件,避免全盘扫描的资源浪费,索引更新零延迟,确保搜索结果实时性。

这就好比系统有一个自带的“变更小本本”(UsnJrnl),而腾讯电脑管家一直盯着“小本本”看,索引瞬间更新,搜出来的结果永远是最新的。

除了方式上的创新,在能力上,腾讯电脑管家也在帮助用户挖掘PC的潜力。

当下的PC端处理器都为多核处理器,多核协同能力是很多PC应用重点发力的方向(例如3A游戏提升多核性能降低对显卡的需求)。腾讯电脑管家同样如此,其在文件搜索环节创新采用多线程并发检索机制,针对不同磁盘分区分配独立线程,充分利用多核CPU资源——“人多力量大”,同时派好几个“线程小工”去不同的区域找资料,这无疑能提升大规模文件检索效率,深层目录/大文件夹场景响应也会更快。

那种传统搜索“一核工作,多核围观”的情况在这里不会再有。

由此,通过底层原生解析、实时变更感知、多线程优化等创新技术手段,腾讯电脑管家解决了传统文件检索方案在性能、实时性和资源占用等方面的痛点,具备明显的技术领先性和行业影响力。

值得一提的是,腾讯电脑管家这套产品架构设计有良好的开放性和可扩展性,可以内嵌到很多其他应用当中,目前其甚至对外提供有SDK供第三方使用。

而不止于搜索性能的提升,腾讯电脑管家还着手解决PC用户在搜索体验上的一些深度需求,这使得其能够成功区别于Everything等常用的单一功能搜索软件,具备更多创新价值。

这主要表现在三个方面。

1、随意搜

很多用户在搜索时,只记得文件名的一部分,写不全,或者有特殊的关键词匹配需求,传统搜索的准确率不佳。

腾讯电脑管家让用户能够随心所欲“花样搜”:支持模糊匹配(记不全也能搜)、前缀匹配(输入开头就行)、甚至正则表达式(高级用户),还能智能处理中英文混输、特殊符号,例如输入“2024 报告”可能找到“2024年度总结报告.docx”,从而减少无效匹配,提升复杂关键词的搜索准确率与速度。

2、内容深入搜

用户往往不满足只搜索文件名,需要进行文件内容的深入、精确搜索。腾讯电脑管家的本地搜索支持多种文档内容全文检索精准,支持模糊匹配与多关键词组合。

这其中牵扯很多细节技术。

首先是如何对文档内容进行解析。这方面腾讯电脑管家在内容索引阶段使用IFilter接口和自研的XML解析模块,能够自动解析并提取常见文档格式(如PDF、Word、PPT、Excel等)的文本内容,极大提升了多格式文档的兼容性和解析效率。

解析后,是如何进行索引。腾讯电脑管家采用jieba分词算法进行高效分词,并对分词结果进行去重处理,形成“文档-词列表”的对应关系集合,随后,系统基于分词结果反向建立“分词-文档列表”的倒排索引结构。

这等于自己构建了一个“关键词地图”,当用户搜索文档内容时,直接“查地图”就能瞬间找到所有相关文档,不用再挨个打开文件去读,速度极快,不仅提升了检索性能,还显著降低了系统资源消耗。

3、多模态搜

用户日常需要搜索的内容早已不只有文档,各类图片份额越来越大,一些创作类用户可能日常主要需要的就是搜索图片。

腾讯电脑管家在这方面支持内容/人脸/OCR多维度搜索,如人脸聚类自动归档、OCR提取图中文字等。

在AI模型的帮助下,腾讯电脑管家能够识别图片里有什么东西(物品分类,预训练模型识别内容)、是谁(人脸识别聚类,通过5点校正+特征向量提取+HDBSCAN聚类技术)、甚至图片里的文字(飞桨开源模型,OCR文字识别)。

如此,用户就能搜“猫的照片”、“张三的照片”、“包含‘发票’文字的截图”等等,多种模态搜索更加随心所欲。

当然,这些创新背后还离不开腾讯电脑管家在文档分类方面的技术探索,目前其已经形成“快速浏览内容-提取特征关键词-关键词云端AI大模型分析-智能判断文档类型”的智能文档归类过程,帮助提升检索效率和质量。

总而言之,在一系列技术创新下,腾讯电脑管家让本地搜索彻底告别暴力穷举,而正在成为用户PC端上的智能导航,体验得到了极大提升。

与数据亲密接触,隐私安全是最后一道关卡

任何技术创新除了解决旧有痛点,很多时候也引发新的担忧,例如大模型的应用就带来隐私安全的担忧。

与用户数据亲密接触,搜文档内容、识别图片人脸,这些功能听着好用,但一些用户可能会担心应用把私人文件内容都上传到服务器。而在腾讯电脑管家这里,这种担心可以完全放下。

在提升搜索体验的同时,腾讯电脑管家对用户隐私安全也有完备的保障:

1、数据本地化处理——“活都在家干”,文件内容解析、图片人脸识别/OCR、文档特征提取均在设备端完成,原始数据不上传云端。

2、最小化数据传输——“只传纸条不传原件”,只有文档智能分类这一步需要用到云端大模型,但上传的不是文档原文,而是电脑本地提取出来的几个关键词和文件名。

3、免第三方依赖——“不依赖外人”,文件索引的核心(读MFT和UsnJrnl)直接用Windows系统自带的机制,不依赖可能有风险的第三方软件库。

可以说,腾讯电脑管家既让用户找文件快如闪电(底层读取+实时更新+多核并行),又让用户搜得又全又准(文件名花样搜+文档内容挖得深+图片看得懂),在整理文件上也更智能(AI帮忙分类),而最关键的是,做这些事的时候用户的隐私文件安全有保障(关键操作本地做,敏感内容不上传)。

如此,用户在电脑上找资料时遇到的烦心事都被考虑到,并且用技术手段进行解决。PC应用,也可以大胆谈用户体验了。

*本文图片均来源于网络

此内容为【智能相对论】原创,

仅代表个人观点,未经授权,任何人不得以任何方式使用,包括转载、摘编、复制或建立镜像。

部分图片来自网络,且未核实版权归属,不作为商业用途,如有侵犯,请作者与我们联系。

•AI产业新媒体;

•澎湃新闻科技榜单月度top5;

•文章长期“霸占”钛媒体热门文章排行榜TOP10;

•著有《人工智能 十万个为什么》

•【重点关注领域】智能家电(含白电、黑电、智能手机、无人机等AIoT设备)、智能驾驶、AI+医疗、机器人、物联网、AI+金融、AI+教育、AR/VR、云计算、开发者以及背后的芯片、算法等。

智能相对论
智能和车,边评边测;未来和家,且品且鉴。合作+V:aixdlun

特别声明:文章版权归原作者所有,文章内容为作者个人观点,不代表大咖秀专栏的立场,转载请联系原作者获取授权。(有任何疑问都请联系wemedia@yesky.com)