当前位置: 首页 > 科技观察

香!用一行命令实现文本检索电脑图片

时间:2023-03-22 17:13:48 科技观察

香!用一行命令从计算机图片中检索文本让你从70,000张照片中找到一张猫的照片。碰撞?不过就在最近,一个国外小伙想出了一个神器——只需要一行代码就可以轻松搞定这种大海捞针。就像刚才说的找“猫图”:安装神器,在终端进入你保存照片的文件夹,输入“rclipcat”——很快就会列出10张与猫相关的照片!当然,文字显示不直观,可以在图片查看器中添加一条命令进行预览:另一个抽象的:找到与“爱”相关的东西。几秒钟后,出现了四张人类或动物相互拥抱的照片(以及三朵“拥抱”向日葵中的一朵)。是不是很有用?看到这里,你可能会说有一些程序可以检索带有文本的图像。但是,我发现他们中的大多数只能用有限的预设词来搜索——这就是他的工具和他们最大的区别。在下面尝试。找到一只正在打呵欠的狗,您可以输入“ayawningdog”。完毕!再来一张《跳山的女人》:完美!结果非常准确。emmm,如果您发现不准确,很可能是您的描述有问题。比如你想找一些人像,但是如果直接输入“人像”,你可能会得到一堆人、狗、猫的“人像”:这肯定不是你想要的,这样描述:一张人像的人,结果是对的:你兴奋吗?这是一个简单的CLIP界面,你也可以试试我哥的这个名为“rclip”的工具。顾名思义,这是通过可以准确匹配图像和文本的CLIP完成的。(rclip代表recursionCLIP,即递归CLIP)更准确地说,rclip是CLIP的一个简单接口。当你输入查询文本时,它要做的就是加载模型,提取你选择的目录下所有图片的特征向量,存入数据库(小弟用的SQLite)。其中,提取操作只会执行一次,也就是你第一次检索的时候。然后它从你输入的查询文本中提取特征向量,计算它与你的图像特征向量库之间的相似度,最后输出最相似的图像。下面是安装和使用方法:首先去GitHub下载rclip最新的AppImage文件:是的,该工具目前只支持Linuxx86_64...如果你使用的是Linux,下载后执行下面两行即可使用:$chmod+xrclip-v1.0.0-x86_64.AppImage$sudomvrclip-v1.0.0-x86_64.AppImage/usr/local/bin/rclip安全之后,就可以cd进你保存图片的目录,然后启动搜索“rclip+'关键字'”。第一次从所有图像中提取特征向量会花费一些时间,具体取决于您存储的图像数量和您的CPU性能。附言。小弟的72769张照片是在性能较低的IntelCeleronJ3455处理器上跑了一天。如果只想要前5张照片,在本地默认图片查看器上预览,可以使用如下命令:$rclip-nf-t5"kitty"|xargs-d'\n'-n1xdg-open最后,在线等待有没有在Windows/Mac上实现这个功能的工具啊!GitHub:https://github.com/yurijmikhalevich/rclipdemo视频:https://www.youtube.com/watch?v=tAJHXOkHidw