第30期【2024年12月21日-2024年12月28日】
科技推荐
今天给大家推荐两个有趣的浏览器扩展,
第一个叫 NSFW Filter,是一个开源扩展。
NSFW 全称为 Not Safe For Work,翻译过来是 上班不要看,
用更好理解的词来说就是 “少儿不宜”。
NSFW Filter 的功能顾名思义,就是把浏览器上所有少儿不宜的内容都过滤掉。
安装之后,我随意在某搜索引擎搜索 “帅哥美女”,就会发现,很多图片都被模糊处理了。
还可以在扩展设置中,调整它的过滤程度,以及过滤效果,一共有 模糊、隐藏、黑白 三种模式。
第二个扩展,叫做 auto-incognito 自动隐私模式,
它的功能也非常简单,就是在你打开某些某些网站的时候,自动开启浏览器的无痕窗口,
在无痕窗口下,你所有的浏览器记录都不会被保留,并且登录的账号信息也不会和主窗口同步。
非常适合用来打开某些隐私的网页,
或者测试人员需要一个网站登录多个账号,进行测试的情况,
在扩展的设置里,还有一个叫 “启用密码” 的选项,
设置之后,就可以把你的隐私网址清单隐藏掉,让别人无法查看。
nsfw-filter:https://github.com/nsfw-filter/nsfw-filter
自动隐私模式:https://microsoftedge.microsoft.com/addons/detail/自动隐私模式/jifongmjndlfaakddlefojdgnijchfio
自动隐私模式:https://chromewebstore.google.com/detail/auto-incognito/iligdhpfclclkdegfdicjniagankbpdb
开源项目
1.QVQ
说实话,通义千问真的太狠了,
目前 AI 大模型最前沿的领域——视觉推理,
通义又又又开源了,
全新的 QVQ-72B-Preview,已经上线 huggingface、魔搭社区 和 Github。
什么是视觉推理模型?简单来说,就是既拥有 视觉理解能力,又拥有 极强逻辑推理能力 的大模型。
举一个简单的例子:
这,是高考试卷中的一道物理题目,
视觉推理模型不光要理解题目中的文字图片,还需要进行逻辑推理得出答案。
把题目上传给 QVQ,可以看到,它首先正确理解了题目中的文字和图片内容,
然后,依据题目想要考察的知识点,进行思考,
它会一边推理,一边反思,检查之前的推理结果,
并提出各种可能的方案,最终给出一个 AI 认为最正确的答案。
而根据我的测试结果来看,它在物理、化学、数学等方面都表现良好,
我拿各种高考题目去测试,结果的正确率都非常高。
官方在四个数据集上,进行了评测,
QVQ 的能力,接近于OpenAI-o1,高于 GPT-4o,能和Claude3.5不相上下,
而在开源模型里,更是一枝独秀。
现实中的很多问题,它也能解决的不错,
比如:给他一张物体图片,它可以粗略估计物体的大小。
给它一张模糊不清的手稿,问它手稿的主人是谁,具体讲了什么。
从结果来看,它的理解能力非常惊人,不但能推断出作者,甚至能知道手稿讲了什么内容。
而最重要的一点是,QVQ 是完全开源的,
并且可以毫不夸张的说,是目前最强的开源视觉推理模型,
根据官方的博客来看,通义目前还在进一步的增强它的思考能力和推理能力,并最终朝着 AGI 迈进,
感兴趣的可以关注一下。
我的评价是:上一次是 QWQ,这次是 QVQ,通义在颜文字上越走越远,建议下一次模型叫 QAQ。
QVQ(开源视觉推理模型):https://qwenlm.github.io/zh/blog/qvq-72b-preview/
2.The Fuck
虽然这个项目的名字有点奇怪,但功能却非常实用,
这,是一个开源的命令行纠错工具,
假如我现在要在命令行输入命令 git branch,但一不小心打错了,
正常情况下,命令行只会提示命令错误 或者不存在,
而使用了 The Fuck 之后,我又一不小心输错了命令,
这时,只需要 fuck 一下,它就会提示我可能想要的正确命令,
按下回车,就能选中当前命令,并一键执行。
如果当前命令不对,还可以用方向键进行切换。
TheFuck(命令行纠错):https://github.com/nvbn/thefuck
3.DeepSeek-V3
MoE 模型 DeepSeek-V3 正式开源,公布了模型和论文,
改模型的发布,引起了国内外广泛的讨论,
其中很重要的一个原因是,它仅仅用了 557.6万 美元的成本,
就达到了目前的顶尖模型,GPT-4o 和 Claude-3.5-Sonnet 的水平;
DeepSeek-V3:https://api-docs.deepseek.com/news/news1226