1. 项目概述
Page Assist 是一款基于 Chrome 浏览器的扩展插件,它为本地运行的 AI 模型(如 Ollama)提供了便捷的 Web UI 交互界面。作为一名长期从事 AI 工具测试的技术人员,我发现这款插件完美解决了本地 AI 模型交互体验差的问题,让用户能够像使用 ChatGPT 一样方便地调用本地模型。
这个工具特别适合以下几类人群:
- 需要频繁使用 AI 进行文档处理的文字工作者
- 经常需要阅读外文资料的研究人员
- 需要 AI 辅助代码分析的开发者
- 注重隐私保护,不愿将敏感数据上传云端 AI 的用户
2. 环境准备与插件安装
2.1 前置条件检查
在安装 Page Assist 插件前,需要确保以下环境已就绪:
- Chrome 浏览器:建议使用最新稳定版(版本 120+)
- Ollama 服务:需要提前安装并配置好 Ollama
- 本地 AI 模型:至少下载一个可用的模型(如 deepseek-r1:8b)
提示:可以通过在终端运行
ollama list命令来检查已安装的模型列表。如果没有任何模型,需要先执行ollama pull 模型名下载。
2.2 插件下载与安装
- 访问 Crx 搜搜网站(https://www.crxsoso.com)
- 在搜索框输入 "Page Assist"
- 找到正确的插件(通常第一个结果就是)
- 点击下载按钮获取 CRX 文件
安装步骤详解:
- 在 Chrome 地址栏输入
chrome://extensions/并回车 - 打开右上角的"开发者模式"开关
- 将下载的 CRX 文件直接拖拽到扩展程序页面
- 在弹出的确认对话框中点击"添加扩展程序"
安装完成后,你会在浏览器右上角看到 Page Assist 的图标。如果图标未显示,可以点击拼图图标,然后固定 Page Assist。
3. 基础功能使用指南
3.1 服务连接与验证
首次使用需要确保 Ollama 服务正常运行:
bash复制# 启动 Ollama 服务(如果尚未运行)
ollama serve
在终端看到类似以下输出表示服务已正常启动:
code复制Listening on 127.0.0.1:11434
3.2 基础对话功能
- 点击浏览器右上角的 Page Assist 图标
- 在顶部下拉菜单中选择已安装的本地模型
- 在输入框中键入你的问题或指令
- 按回车发送
注意:首次使用某个模型时,插件可能需要几秒钟时间来加载模型。如果长时间无响应,可以尝试刷新页面或重启 Ollama 服务。
3.3 预设提示词模板使用
Page Assist 提供了多种预设的提示词模板,可以大幅提升工作效率:
- 总结模板:快速提取文章核心内容
- 翻译模板:实现多语言互译
- 代码助手:解释、优化和注释代码
- 邮件撰写:帮助起草专业邮件
使用方法:
- 在插件界面点击"Select a Prompt"下拉框
- 选择适合当前场景的模板
- 系统会自动填充预设的提示词
- 根据需要补充具体内容后发送
4. 高级功能深度解析
4.1 网页内容智能处理
这是 Page Assist 最强大的功能之一,可以实现:
-
自动内容提取:
- 打开目标网页
- 点击插件图标
- 输入"总结这篇文章的主要观点"
- 插件会自动抓取网页正文进行分析
-
上下文问答:
- 在阅读技术文档时
- 可以直接提问"这段描述中的XXX概念是什么意思"
- AI 会基于当前网页内容给出精准解释
-
重点标注:
- 输入"提取本文的5个关键点"
- AI 会生成带编号的重点摘要
4.2 文本选中操作
对于网页中的特定文本,可以通过右键菜单快速调用 AI 功能:
- 选中目标文本
- 右键点击
- 选择"Page Assist"子菜单
- 选择需要的操作(翻译、改写、解释等)
这个功能在处理外文资料时特别有用,比传统翻译插件更智能,能保持上下文一致性。
4.3 代码辅助实战
对于开发者而言,代码辅助功能堪称神器:
-
GitHub 代码分析:
- 打开 GitHub 仓库中的代码文件
- 选中关键代码段
- 右键选择"解释这段代码"
- AI 会逐行分析代码功能
-
代码优化建议:
- 输入"如何优化这段代码的性能"
- AI 会给出具体的优化方案
-
错误排查:
- 粘贴错误信息
- 询问"这个错误可能是什么原因导致的"
- AI 会列出可能的故障点
5. 高级配置与优化
5.1 服务端配置
点击插件界面右上角的齿轮图标进入设置页面,可以调整以下重要参数:
-
Ollama 服务地址:
- 默认:http://localhost:11434
- 如果 Ollama 运行在其他设备上,需要修改为对应 IP
-
模型参数:
- Temperature:控制生成结果的随机性(0-1)
- Max Tokens:限制单次生成的最大长度
-
网络代理:
- 如果需要通过代理访问,可以在此配置
5.2 提示词模板管理
在设置页面可以:
- 查看所有内置模板
- 编辑现有模板
- 添加自定义模板
创建高效模板的技巧:
- 明确指定输出格式要求
- 包含具体的限制条件
- 使用示例说明期望结果
- 为不同场景创建专用模板
5.3 模型管理
-
切换模型版本:
- 某些模型有多个版本(如7b、13b等)
- 可以在设置中选择特定版本
-
模型更新:
- 定期运行
ollama pull 模型名获取更新 - 更新后需要在插件中刷新模型列表
- 定期运行
6. 常见问题排查手册
6.1 服务连接问题
症状:插件显示"Ollama is not running"
解决方案:
- 确认终端中 Ollama 服务正在运行
- 检查防火墙设置,确保11434端口开放
- 验证环境变量 OLLAMA_HOST 是否设置正确
- 尝试重启 Ollama 服务
6.2 模型加载问题
症状:模型列表为空或无法选择模型
排查步骤:
- 运行
ollama list确认模型已正确安装 - 检查模型文件是否完整(可尝试重新pull)
- 确保模型与当前 Ollama 版本兼容
- 查看终端日志是否有加载错误
6.3 插件功能异常
症状:插件无响应或功能不全
解决方法:
- 在 chrome://extensions/ 中禁用再启用插件
- 清除浏览器缓存后重试
- 检查是否有其他扩展冲突
- 尝试在Chrome隐身模式下测试
7. 性能优化建议
-
模型选择策略:
- 轻量级任务使用7b/8b小模型
- 复杂任务切换到13b/更大模型
- 根据显存大小合理选择
-
参数调优:
- 响应速度要求高时,降低max_tokens
- 需要创造性输出时,提高temperature
- 精确性要求高时,使用top_p=0.9
-
硬件加速:
- 确保正确配置CUDA(NVIDIA显卡)
- 考虑使用M系列Mac的Metal加速
- 大模型可启用量化版本减少显存占用
在实际使用中,我发现将 temperature 设置为0.7,max_tokens 限制在1500左右,能在响应速度和输出质量间取得很好平衡。对于代码相关任务,使用更低的temperature(0.3-0.5)可以获得更确定性的结果。