
Google在Pixel 9 中推出了Pixel Screenshots 功能,利用大模型,帮助用户更智能地管理和利用屏幕截图信息。Pixel Screenshots的核心功能是基于Pixel 9 设备内置的Gemini Nano模型,该模型能够直接在设备上分析图像内容,使截图变得可搜索。支持用户通过自然语言搜索截图信息,大大提高了信息检索的效率。
Pixel Screenshots是Pixel 9 系列(Pixel 9/Pixel 9 Pro/Pixel 9 Pro XL /Pixel 9 Pro Fold )设备独占功能,且支持的国家和语言都有限制。
Shots Studio 是一款灵感源自 Pixel Screenshots 的开源 AI 截图管理器,能将杂乱无章的截图库整理成一个智能有序的存档,让截图可搜索、可标记,且易于浏览。
Shots Studio 基于 Flutter 构建,可在任何 Android 设备上运行。由于Flutter的跨平台性,支持iOS也比较容易。
项目地址:https://ansahmohammad.github.io/shots-studio/
使用 Shots Studio,您可以:
- 用自然语言搜索屏幕截图内容,而不仅仅是按文件名
- 使用 AI 自动添加或生成标签
- 将相关屏幕截图分组到自定义集合中
Shots Studio的主要功能:
-
人工智能搜索:通过屏幕截图中包含的文本 、 对象或主题来搜索屏幕截图
-
智能标记:让 AI 建议相关标签或手工添加标签,以保持图片库整洁且内容丰富
-
整理成集合:将相关的屏幕截图分组到命名的集合中,以便轻松导航。
-
可定制的 AI 能力:目前可以选择 Gemini 2.0 Flash 或Gemini 2.5 Pro 。预计后期会支持ChatGPT等大模型
- 隐私第一:除了调用 Gemini API 对截图进行处理外,Shots Studio 不会存储或访问您的屏幕截图
-
开源
Shots Studio的前景很值得期待。
其实为了更好保护隐私性,Shots Studio可以增加对 CLIP (Contrastive Language-Image Pre-Training) 模型的支持,不用依赖于Gemini、ChatGPT等大模型。
CLIP模型能够实现对图片的内容理解、智能分组、文本内容搜索,具体可以参考:图片智能组织和内容搜索应用汇总