第一次用Zotero Connector抓取知乎回答时,我盯着自动生成的参考文献条目愣了半天——原来文献收集可以像网购下单这么简单。这个浏览器插件就像个智能收割机,能在你浏览学术网页时自动识别文献信息,点击按钮就能把书目数据、PDF文件甚至网页快照打包收进Zotero库。比起传统的手动输入参考文献,效率提升至少十倍。
作为Zotero生态中最核心的浏览器扩展,Connector支持Chrome、Firefox、Edge和Safari四大主流浏览器。它的工作原理是通过内置的翻译器(translators)识别不同网站的结构特征,比如在Google Scholar会抓取论文标题、作者和DOI,在豆瓣则自动提取书籍的ISBN和出版信息。实测下来,这个插件对中英文主流学术平台的平均识别准确率能达到95%以上,连B站视频和知乎专栏这类非传统学术资源也能完美捕获。
在Chrome商店搜索"Zotero Connector"时,注意认准由zotero.org官方发布的版本。安装后记得在扩展管理页面开启"允许访问文件网址"权限,否则无法抓取本地PDF文件。我推荐把插件图标固定在工具栏,这样在学术网站浏览时会显示彩色图标(表示可抓取),而在普通网页则显示灰色。
提示:如果无法访问Chrome商店,可以直接从Zotero官网下载crx文件,通过开发者模式手动安装
右键点击插件图标选择"选项",这几个设置项值得特别关注:
由于Zotero默认对中文支持较弱,推荐同步安装Jasminum插件。这个国产插件能自动补全知网文献的中英文双语元数据,还能把CAJ文件转换成可读的PDF格式。具体操作是在Zotero的"编辑-首选项-高级"中,将默认数据目录设置为Jasminum的安装路径。
在知网搜索页面,Connector图标会显示可抓取的文章数量。比起全选导出,我更推荐按住Ctrl键逐篇勾选,这样可以避免导入无关文献。有个实用技巧:在高级搜索中使用"SU=关键词"的检索式,配合Connector的批量选择,能快速建立专题文献库。
导出的文献如果出现作者名乱码,可以右键选择"重新抓取元数据",通常能自动修复。对于学位论文,Connector会自动区分导师和学生作者,这个细节处理比很多付费软件都到位。
在知乎问题页面上,Connector不仅能保存单个回答,还能把整个讨论串打包保存。实测保存的知乎内容会保留原排版格式,包括代码块和数学公式。对于豆瓣读书页面,除了基本信息外,插件还会自动抓取书籍评分和热门短评,这对写文献综述时的观点引用特别有用。
百度学术的导出有个隐藏功能:在检索结果页勾选多篇文献后,Connector会生成合并的BibTeX引用文件。最近发现对微信公众号文章也支持良好,只要在电脑端打开文章链接,点击插件就能保存完整的图文内容。
Google Scholar的抓取要注意设置显示摘要(在搜索设置中开启),这样导入Zotero的文献会自带摘要信息。PubMed的导出更智能,不仅能识别PMID编号,还会自动关联MeSH主题词。我在做系统综述时,先用Connector保存200篇PubMed文献,再用Zotero的标签云功能分析高频关键词,效率提升惊人。
Web of Science的导出建议选择"全记录与引用参考文献"格式,这样会包含参考文献列表。配合Zotero的"生成报告"功能,能快速分析某个课题的引文网络。
Sci-Hub+Zotero Connector堪称黄金搭档:在Zotero选中没有全文的文献,右键选择"查找可用PDF",系统会自动通过DOI在Sci-Hub搜索并附加到条目中。有个少有人知的技巧:在Connector设置里添加自定义PDF解析器,可以突破某些出版社的下载限制。
对于ResearchGate上的预印本论文,Connector会智能区分正式发表版本和预印本。最近新增的arXiv支持更是方便,导入的预印本会自动标注提交日期和最新版本号。
B站视频的抓取效果出人意料的好,导入的视频条目会包含up主信息、播放量和弹幕数量。对于微信公众号合集,Connector能保持文章间的原始顺序,这对跟踪系列教程特别有用。甚至在一些知识付费平台,只要页面有标准的元数据标记,插件也能准确识别课程信息。
我在管理技术文档时发现,Connector对GitHub仓库的识别正在不断优化,现在能抓取仓库的star数、fork数和主要编程语言。抓取的Stack Overflow问答会保留投票数和最佳答案标记,方便后续重点阅读。
用Zotero的批量编辑功能配合Connector特别高效:先导入一批文献,全选后右键"查找元数据",系统会自动补全缺失信息。对于抓取的网页快照,可以用"提取注释"功能把网页高亮内容转成可搜索的文本。
通过Zotero的API接口,可以把Connector和自动化工具连接起来。我常用的工作流是:用浏览器插件抓取文献→触发IFTTT自动备份到Notion→通过Zapier同步到阅读器。对于需要定期跟踪的期刊,可以设置浏览器定时刷新+Connector自动抓取新文章。
虽然手机端没有Connector插件,但通过Zotero的浏览器书签工具也能实现类似功能。保存的文献会同步到所有设备,在iPad上用Zotero App做批注后,回到电脑端能自动合并修改。最近发现用浏览器远程调试功能,甚至可以在手机端触发电脑上Connector的抓取动作。