开源版 Manus 火爆全网,狂揽 7.5 万 GitHub Star!

2026 新年刚开始,科技圈最重磅的消息,莫过于 Meta 豪掷 20 亿美金,收购号称“通用智能体”的 Manus。

此前也体验过 Manus,不得不说其自动化能力确实惊艳。只需给它一个目标,就能帮我们自动操作电脑,把事情干完。

但现在被收进了大厂里,后续能力或许能成倍放大,但是使用价格必然也会随之提升。

与其同时,我在 GitHub 上发现Browser Use这个被称之为开源版的 Manus,伴随着这波热度,Star 数一路狂飙到了 75000+。

它能让 AI 真正接管浏览器,像真人一样点击、滚动、输入,替我们完成那些繁琐的重复性工作。

以前做网页自动化,基本都是靠 Selenium,但网站一改版,脚本就报废,这种痛苦经历搞爬虫的朋友会经常遇到。

现在 Browser Use 为我们提供了新的解决方案:给 AI 装上了“眼睛”

基于 Playwright 和视觉大模型(Vision Model),不再是去扒网页代码,而是像人类一样“看懂”页面内容。

不管网页底层代码结构怎么变,它都能通过看理解页面上的所有内容,进而帮我们完成操作。

在官方文档里有三个特别实用的场景,每一个都直击痛点,下面逐一跟大家说说。

首先是打工人都懂的“海投简历”。

以前投简历,最烦的就是在不同网站上重复填写那些永远填不完的表格。

官方演示了一个非常实用的指令:“用我的简历信息填好这份申请表”。

Browser Use 启动后,会自动打开招聘页面。它能精准识别出“姓名”、“邮箱”、“工作经历”这些输入框,然后把你的资料填进去。

哪怕遇到下拉菜单或者勾选框,它也能像人一样处理得妥妥当当。

再来看一个生活场景应用,比如“电商购物”。

如果你有一份很长的购物清单,可以直接甩给它:“把这些东西加到我的购物车里”。

它会像真人一样浏览商品列表,通过视觉识别出哪个是你要的牌子,然后点击“加入购物”。

这中间更绝的是,如果网页出现弹窗广告,它不会像传统脚本那样傻傻地报错,而是会像真人一样找到关闭按钮点掉它,然后继续干活。

还有一个场景很适合喜欢组装电脑的朋友,那就是“电脑配件筛选”

像以往我们想组装一台电脑,需要去了解大量配件的参数,以及它们之间兼容性。

有了 Browser Use,只需简单一条指令:“我想组装一台台式电脑,预算在 5000 元以内,帮我找到合适的配置”。

它就会自动搜索 CPU、显卡、主板,对比参数和价格,帮我们完成初步筛选。这比我们自己一个个去搜索效率真的高出不少。

从这些官方演示案例中可以看出,都是通过代码来启动自动化脚本的,很多朋友此时会觉得使用起来比较难。

但我想说恰恰相反,它的核心启动代码其实就如下几行:

from browser_use import Agentfrom langchain_openai import ChatOpenAI# 选择一个聪明的大脑(比如 Gemini 3 Pro)agent = Agent( task="帮我查一下明天去上海的高铁票", llm=ChatOpenAI(model="gemini-3-pro"))# 开始干活await agent.run()

就这几行代码,就能让 Browser Use 运行起来,自动打开浏览器执行任务。

当然,还得跟大家说实话,Browser Use 的强大,是要靠消耗大量 Token 来换取的。

在使用过程,它会不断地截图、发给大模型分析、再决策,这一套流程下来,如果全程用 Gemini 3 Pro,成本确实不低。

不过好在也有办法解决,我们可以用比较便宜的 OCR 模型,甚至自己本地一个 DeepSeek-OCR 模型,来充当“眼睛”,负责识别页面文字和坐标。

然后在需要做复杂决策(比如判断哪个机票更划算)的时候,才调用昂贵的 GPT-5 或 Claude 4.5。

这样一来,成本就可以直接砍掉一大截,让人人都雇得起这位 “数字员工”。

总的来说,Browser Use 算是给了我们多一个选择权。

Manus 很好,但已成为了大厂的壁垒。Browser Use 也许还需要打磨,但代码是掌握在我们自己手里。

如果我们受够了在浏览器里重复点击鼠标,或者想体验一下拥有 “私人 Jarvis” 的感觉,这个项目值得一试。

GitHub 项目地址:https://github.com/browser-use/browser-use

今天的分享到此结束,感谢大家抽空阅读,我们下期再见,Respect!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1132007.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

企业级墙绘产品展示交易平台管理系统源码|SpringBoot+Vue+MyBatis架构+MySQL数据库【完整版】

摘要 随着数字化经济的快速发展,传统墙绘行业面临信息不对称、交易效率低下等问题。企业级墙绘产品展示交易平台的出现,为墙绘设计师、供应商和客户提供了高效的在线交互渠道。该平台通过整合行业资源,优化交易流程,解决了传统模式…

Oracle数据库中的层次查询优化

在处理大型数据库中的层次查询时,性能优化是一个关键问题。本文将通过一个实际的例子,探讨如何优化Oracle数据库中使用CONNECT BY NOCYCLE PRIOR语句的查询。 问题背景 假设我们有一张名为TABLE1的表,包含客户号(CUST_NUM)、客户ID(CUST_ID)、等级(TIER)、开始日期(…

基于CNN的车牌识别网络

前期准备 这篇博客记录神经网络方法与应用的实验项目,项目开源链接:【免费】神经网络课程设计项目.zip资源-CSDN下载 数据集 数据集是我本人在百度飞桨网站上找到的,这个数据集整理的很全面详细,数据集信息包含10w张训练照片&a…

Spring Boot 钩子全集实战(五):ApplicationContextInitializer详解

Spring Boot 钩子全集实战(五):ApplicationContextInitializer 详解 在上一篇中,我们深入剖析了 SpringApplicationRunListener.environmentPrepared() 这一关键扩展点,实现了环境合法性校验、启动上下文传递、多环境…

【Git核心操作实战】从初始化到冲突解决与回滚(附完整演示)

文章目录目录引言环境准备一、仓库初始化与首次提交1.1 初始化 Git 仓库1.2 创建 .gitignore 文件1.3 首次提交技术解析二、分支创建与多轮小步提交2.1 切出 feature 分支2.2 2-3 次小步提交第一次提交:新增功能基础文件第二次提交:实现核心逻辑第三次提…

Teams Webhook 传递长文本的技巧与示例

引言 在团队协作工具中,Microsoft Teams和Slack是两个非常流行的选择。它们都支持通过Webhook发送消息,但有时你会发现Teams在处理长文本消息时会遇到一些限制。本文将详细介绍如何使用Teams Webhook传递多行文本,并确保URL链接可以点击,内容完整显示,就像用户直接输入一…

Apache Paimon多模态数据湖实践:从结构化到非结构化的技术演进

在近期的 Streaming Lakehouse Meetup Online EP.2|Paimon StarRocks 共话实时湖仓 直播中,Apache Paimon PMC 成员/阿里云数据湖资深工程师叶俊豪带来了关于 Paimon 多模态数据湖的深度技术分享。随着大模型训练对数据规模与多样性的要求不断提升&…

利用多进程提升图表模拟程序的性能

引言 在实时数据处理和图表模拟的领域,程序的响应速度和效率至关重要。特别是当我们处理大量数据并需要实时更新图表时,如何高效地利用系统资源就成为了一个关键问题。今天我们来探讨如何通过多进程来优化一个图表模拟程序的性能。 问题描述 我们有一款图表模拟程序,用于…

基于Java+SpringBoot+SSM儿童医院挂号管理系统(源码+LW+调试文档+讲解等)/儿童医院预约系统/儿童医院就诊管理系统/医院挂号管理系统/儿童医院挂号平台/儿童医院在线挂号

博主介绍 💗博主介绍:✌全栈领域优质创作者,专注于Java、小程序、Python技术领域和计算机毕业项目实战✌💗 👇🏻 精彩专栏 推荐订阅👇🏻 2025-2026年最新1000个热门Java毕业设计选题…

网上租赁系统信息管理系统源码-SpringBoot后端+Vue前端+MySQL【可直接运行】

摘要 随着互联网技术的快速发展,传统租赁行业正逐步向数字化转型。网上租赁系统作为一种高效、便捷的商业模式,能够有效解决传统租赁过程中信息不对称、管理效率低下等问题。该系统通过整合线上资源,为用户提供租赁物品的浏览、下单、支付及管…

总结了 12 个嵌入式项目

前两天有一个读者问我,如果要做嵌入式项目,哪些项目会比较合适,这里总结了 12 个比较有代表性的项目,使用的cpu 也是主流的,推荐给大家,希望对大家学习有所帮助。1. Avem:轻量级无人机飞控项目项…

使用aop切面springmvc后抛出异常一直捕捉不到异常(抛出异常UndeclaredThrowableException类)

WebLogControllerAop这是一个切面处理类,使用的Around处理切面,有异常必须抛出,不然全局异常捕捉不到的 package cn.geg.lifecycle.config;import cn.geg.lifecycle.util.WebLogUtils; import cn.hutool.core.collection.CollUtil; import cn…

在Azure中实现跨订阅的AMPLS自动链接策略

在Azure环境中,管理和自动化资源链接是提升运维效率和确保安全性的关键。特别是在处理不同订阅的资源时,如何高效地实现跨订阅的自动链接是一个常见的挑战。本文将通过一个实际的案例,详细介绍如何利用Azure Policy实现Application Insights与AMPLS(Azure Monitor Private …

Java Web Web足球青训俱乐部管理后台系统系统源码-SpringBoot2+Vue3+MyBatis-Plus+MySQL8.0【含文档】

摘要 足球青训俱乐部管理后台系统的开发旨在解决传统足球青训俱乐部在管理学员信息、课程安排、教练分配等方面效率低下的问题。随着足球运动的普及和青训体系的完善,俱乐部需要一套高效、智能化的管理系统来优化运营流程。传统的人工记录和Excel表格管理方式容易导…

Flask应用中的实例路径问题探讨

引言 在Flask应用程序开发中,实例路径(instance path)是一个经常被忽视但又非常关键的概念。特别是在部署和管理数据库时,如果不正确处理实例路径,可能会导致一系列难以诊断的问题。本文将通过一个真实的案例,详细探讨Flask实例路径的设置和其在生产环境中的影响。 实例…

上班是一场冷静的交易

将上班视作一场冷静的交易,这并非 cynicism,而是一种珍贵的清醒。它像一副坚固的甲胄,保护我们在职业的疆场上不被无谓的情绪流矢所伤,不被暧昧的期望绑架。我们付出标定好的时间、技能与专注,换取等值的报酬、经验与履…

【2025最新】基于SpringBoot+Vue的师生健康信息管理系统管理系统源码+MyBatis+MySQL

摘要 在当今信息化时代,校园健康管理已成为教育机构重点关注的方向之一。传统的师生健康信息管理多依赖纸质记录或分散的电子表格,存在数据冗余、更新滞后、查询效率低下等问题。随着互联网技术的快速发展,构建一个高效、安全、便捷的师生健康…

实时语音识别回声消除技巧

💓 博客主页:借口的CSDN主页 ⏩ 文章专栏:《热点资讯》 实时语音识别回声消除的实战技巧:突破传统局限目录实时语音识别回声消除的实战技巧:突破传统局限 引言:回声消除——语音识别的隐形守护者 现在时&am…

《斯图尔特微积分(下册)》什么时候出?带答案吗???

《斯图尔特微积分》上册中文版9月出版后,读者评价“讲解语言生动,带入生活实际,能够了解数学公式或定理在其他学科的应用。”“良好的阅读体验,美观的版面和由浅入深的内容。”评论和后台常有人私信下册什么时候出?答案…

解决Unity中按钮点击索引问题

在使用Unity开发游戏或应用时,经常会遇到需要为多个按钮动态添加点击事件并传递索引参数的情况。然而,这种操作在C#中可能会导致一些意想不到的问题。本文将通过一个实际例子,解释这些问题及其解决方案。 问题描述 假设我们有一个ScrollView组件,其内容包含多个Button对象…