最新消息:

Shots Studio,Pixel Screenshots 开源平替,AI 截图管理应用,让截图可搜索、可标记,且易于浏览

佳软 yeeach 803浏览 0评论

 

Google在Pixel 9 中推出了Pixel Screenshots 功能,利用大模型,帮助用户更智能地管理和利用屏幕截图信息。Pixel Screenshots的核心功能是基于Pixel 9 设备内置的Gemini Nano模型,该模型能够直接在设备上分析图像内容,使截图变得可搜索。支持用户通过自然语言搜索截图信息,大大提高了信息检索的效率。

Pixel Screenshots是Pixel 9 系列(Pixel 9/Pixel 9 Pro/Pixel 9 Pro XL /Pixel 9 Pro Fold )设备独占功能,且支持的国家和语言都有限制。

Shots Studio 是一款灵感源自 Pixel Screenshots 的开源 AI 截图管理器,能将杂乱无章的截图库整理成一个智能有序的存档,让截图可搜索、可标记,且易于浏览。

Shots Studio 基于 Flutter 构建,可在任何 Android 设备上运行。由于Flutter的跨平台性,支持iOS也比较容易。

项目地址:https://ansahmohammad.github.io/shots-studio/

使用 Shots Studio,您可以:

  • 用自然语言搜索屏幕截图内容,而不仅仅是按文件名
  • 使用 AI 自动添加或生成标签 
  • 将相关屏幕截图分组到自定义集合中

Shots Studio的主要功能:

  • 人工智能搜索通过屏幕截图中包含的文本 、 对象或主题来搜索屏幕截图

  • 智能标记让 AI 建议相关标签或手工添加标签,以保持图片库整洁且内容丰富

  • 整理成集合将相关的屏幕截图分组到命名的集合中,以便轻松导航。

  • 可定制的 AI 能力目前可以选择 Gemini 2.0 Flash 或Gemini 2.5 Pro 。预计后期会支持ChatGPT等大模型

  • 隐私第一:除了调用 Gemini API 对截图进行处理外,Shots Studio 不会存储或访问您的屏幕截图
  • 开源

Shots Studio的前景很值得期待。

其实为了更好保护隐私性,Shots Studio可以增加对 CLIP (Contrastive Language-Image Pre-Training) 模型的支持,不用依赖于Gemini、ChatGPT等大模型。

CLIP模型能够实现对图片的内容理解、智能分组、文本内容搜索,具体可以参考:图片智能组织和内容搜索应用汇总

 

 

 

发表我的评论
取消评论
表情

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址