Page Assist：本地AI模型Chrome插件使用指南-代码聚汇网

Page Assist：本地AI模型Chrome插件使用指南

N大狼

1. 项目概述

Page Assist 是一款基于 Chrome 浏览器的扩展插件，它为本地运行的 AI 模型（如 Ollama）提供了便捷的 Web UI 交互界面。作为一名长期从事 AI 工具测试的技术人员，我发现这款插件完美解决了本地 AI 模型交互体验差的问题，让用户能够像使用 ChatGPT 一样方便地调用本地模型。

这个工具特别适合以下几类人群：

需要频繁使用 AI 进行文档处理的文字工作者
经常需要阅读外文资料的研究人员
需要 AI 辅助代码分析的开发者
注重隐私保护，不愿将敏感数据上传云端 AI 的用户

2. 环境准备与插件安装

2.1 前置条件检查

在安装 Page Assist 插件前，需要确保以下环境已就绪：

Chrome 浏览器：建议使用最新稳定版（版本 120+）
Ollama 服务：需要提前安装并配置好 Ollama
本地 AI 模型：至少下载一个可用的模型（如 deepseek-r1:8b）

提示：可以通过在终端运行 ollama list 命令来检查已安装的模型列表。如果没有任何模型，需要先执行 ollama pull 模型名 下载。

2.2 插件下载与安装

访问 Crx 搜搜网站（https://www.crxsoso.com）
在搜索框输入 "Page Assist"
找到正确的插件（通常第一个结果就是）
点击下载按钮获取 CRX 文件

安装步骤详解：

在 Chrome 地址栏输入 chrome://extensions/ 并回车
打开右上角的"开发者模式"开关
将下载的 CRX 文件直接拖拽到扩展程序页面
在弹出的确认对话框中点击"添加扩展程序"

安装完成后，你会在浏览器右上角看到 Page Assist 的图标。如果图标未显示，可以点击拼图图标，然后固定 Page Assist。

3. 基础功能使用指南

3.1 服务连接与验证

首次使用需要确保 Ollama 服务正常运行：

bash复制# 启动 Ollama 服务（如果尚未运行）
ollama serve

在终端看到类似以下输出表示服务已正常启动：

code复制Listening on 127.0.0.1:11434

3.2 基础对话功能

点击浏览器右上角的 Page Assist 图标
在顶部下拉菜单中选择已安装的本地模型
在输入框中键入你的问题或指令
按回车发送

注意：首次使用某个模型时，插件可能需要几秒钟时间来加载模型。如果长时间无响应，可以尝试刷新页面或重启 Ollama 服务。

3.3 预设提示词模板使用

Page Assist 提供了多种预设的提示词模板，可以大幅提升工作效率：

总结模板：快速提取文章核心内容
翻译模板：实现多语言互译
代码助手：解释、优化和注释代码
邮件撰写：帮助起草专业邮件

使用方法：

在插件界面点击"Select a Prompt"下拉框
选择适合当前场景的模板
系统会自动填充预设的提示词
根据需要补充具体内容后发送

4. 高级功能深度解析

4.1 网页内容智能处理

这是 Page Assist 最强大的功能之一，可以实现：

自动内容提取：
- 打开目标网页
- 点击插件图标
- 输入"总结这篇文章的主要观点"
- 插件会自动抓取网页正文进行分析
上下文问答：
- 在阅读技术文档时
- 可以直接提问"这段描述中的XXX概念是什么意思"
- AI 会基于当前网页内容给出精准解释
重点标注：
- 输入"提取本文的5个关键点"
- AI 会生成带编号的重点摘要

4.2 文本选中操作

对于网页中的特定文本，可以通过右键菜单快速调用 AI 功能：

选中目标文本
右键点击
选择"Page Assist"子菜单
选择需要的操作（翻译、改写、解释等）

这个功能在处理外文资料时特别有用，比传统翻译插件更智能，能保持上下文一致性。

4.3 代码辅助实战

对于开发者而言，代码辅助功能堪称神器：

GitHub 代码分析：
- 打开 GitHub 仓库中的代码文件
- 选中关键代码段
- 右键选择"解释这段代码"
- AI 会逐行分析代码功能
代码优化建议：
- 输入"如何优化这段代码的性能"
- AI 会给出具体的优化方案
错误排查：
- 粘贴错误信息
- 询问"这个错误可能是什么原因导致的"
- AI 会列出可能的故障点

5. 高级配置与优化

5.1 服务端配置

点击插件界面右上角的齿轮图标进入设置页面，可以调整以下重要参数：

Ollama 服务地址：
- 默认：http://localhost:11434
- 如果 Ollama 运行在其他设备上，需要修改为对应 IP
模型参数：
- Temperature：控制生成结果的随机性（0-1）
- Max Tokens：限制单次生成的最大长度
网络代理：
- 如果需要通过代理访问，可以在此配置

5.2 提示词模板管理

在设置页面可以：

查看所有内置模板
编辑现有模板
添加自定义模板

创建高效模板的技巧：

明确指定输出格式要求
包含具体的限制条件
使用示例说明期望结果
为不同场景创建专用模板

5.3 模型管理

切换模型版本：
- 某些模型有多个版本（如7b、13b等）
- 可以在设置中选择特定版本
模型更新：
- 定期运行 ollama pull 模型名 获取更新
- 更新后需要在插件中刷新模型列表

6. 常见问题排查手册

6.1 服务连接问题

症状：插件显示"Ollama is not running"

解决方案：

确认终端中 Ollama 服务正在运行
检查防火墙设置，确保11434端口开放
验证环境变量 OLLAMA_HOST 是否设置正确
尝试重启 Ollama 服务

6.2 模型加载问题

症状：模型列表为空或无法选择模型

排查步骤：

运行 ollama list 确认模型已正确安装
检查模型文件是否完整（可尝试重新pull）
确保模型与当前 Ollama 版本兼容
查看终端日志是否有加载错误

6.3 插件功能异常

症状：插件无响应或功能不全

解决方法：

在 chrome://extensions/ 中禁用再启用插件
清除浏览器缓存后重试
检查是否有其他扩展冲突
尝试在Chrome隐身模式下测试

7. 性能优化建议

模型选择策略：
- 轻量级任务使用7b/8b小模型
- 复杂任务切换到13b/更大模型
- 根据显存大小合理选择
参数调优：
- 响应速度要求高时，降低max_tokens
- 需要创造性输出时，提高temperature
- 精确性要求高时，使用top_p=0.9
硬件加速：
- 确保正确配置CUDA（NVIDIA显卡）
- 考虑使用M系列Mac的Metal加速
- 大模型可启用量化版本减少显存占用

在实际使用中，我发现将 temperature 设置为0.7，max_tokens 限制在1500左右，能在响应速度和输出质量间取得很好平衡。对于代码相关任务，使用更低的temperature（0.3-0.5）可以获得更确定性的结果。