推特大V同步's avatar
推特大V同步
npub195q4...wpxu
#V2EX ### [分享创造] 自己做了一个低延迟 Voice Agent,不依赖框架实现极低延迟 最近在折腾 voice agent ,之前用 LiveKit 框架做过几个项目,这次想试试纯 API 调用从零搭建,看看到底能做到什么程度。 做出来发现效果还不错:纯文本对话延迟,如果使用 gemini 2.5 flash lite ~500ms,即使是 2.5 flash 或者 3 flash ,也可以控制在 700ms 。带联网搜索或图片分析也能控制在 1000~1500s 。服务全部部署在美国,因此考虑到跨洋的网络延迟,实际上的表现应该可以更好。顺便做了个动态岛 UI 包装了一下。 附个使用演示视频: [![](https://i.imgur.com/loPpmDg.png)](https://i.imgur.com/loPpmDg.png) 之所以做这个,也是对语音这个模态比较看好,故自己搓了一个不依赖框架的实现。如果大家有什么好想法,也欢迎讨论😋 P.S 话说是自己“手搓”,但实际上大部分时候也是 AI 完成,只不过是类似于“同学”一般,相互指引跟学习,那既然大部分的代码都是 AI 实现的(虽然这一过程相比于单纯用框架而言学习到了很多),但这种方式还能叫“手搓”吗?
#德国之声中文 【英国“最稳定官员”:首席捕鼠官就职15周年🐈‍⬛】 15年来,英国换过六任首相,但“首席捕鼠官”赖瑞依然屹立不摇。赖瑞的职务虽然是捕鼠,但他最擅长的其实是抢镜头! #dweuromaxx [![](
#V2EX ### [分享发现] AstrBot 开源了,支持 QQ、企业微信等几十种平台 是个强大的一站式 Agentic 助手。 支持 QQ 、企业微信等几十种平台。 有近 800 个插件可以用。 让每个聊天软件都拥有 AI Agent 。 <https://laosu.tech/2026/02/18/AstrBot%EF%BC%9A%E8%AE%A9%E6%AF%8F%E4%B8%AA%E8%81%8A%E5%A4%A9%E8%BD%AF%E4%BB%B6%E9%83%BD%E6%8B%A5%E6%9C%89AI%20Agent>
#V2EX ### [问与答] 请问纯 vibe coding 了一个项目,有啥自动化一点的测试方案么? 大佬们好,最近尝试纯 vibe coding 了一个项目,基本就是纯粹丢给 ai 一个大的任务,具体的细节实现都没看,导致现在也不知道怎么测试比较好,只能自己点点点,所以请问下目前有啥成熟 ai 测试的方案么
#V2EX ### [分享创造] 运营转型,独立开发了一个月,我做了一个 AI 视频/AI 图片 生成工具,想听听大家的建议 各位 V 友好,我是 [PopcornAI Art](https://popcornai.art/)的开发者,从运营转型为独立开发者。花了一个月的时间,终于把这个产品做出来了,想在这里分享一下开发历程,也希望能得到大家的反馈和建议。 ## 一、为什么要做这个产品: 25 年年底,我开始接触 vibe coding ,并尝试用 vibe coding 开发了几个小工具,实现的效果很好,那一刻我的感觉就是,终于不用被束缚了,可以在没有团队,不用花很多钱的情况下,创造产品,并且让别人使用自己的产品了——能看到别人使用自己创造出来的产品,是一件很开心的事情,也是我的心愿。 从那以后,我一直在找方向,坦白讲,是有些拿锤子找钉子的感觉,期间也做了几个小产品:关于时间管理、任务规划等的,但都没有什么反响。 后来通过流量分析,发现 AI 视频生成+AI 图片生成领域的流量很大;再加上我老婆就是做设计和市场方向的,对于素材和视频设计在工作中是刚需,每个月也都要花几百块钱去订购会员,而且也经常不够用;还有就是广告一直以来都是很大的市场,其中视频和图片是广告的基础载体,现在的多模态 AI 的发展,也一定能够为整个广告相关的产业赋能,推动广告产品的进一步发展,同时自身在其中也会扮演越来越重要的作用。 总之就是:市场足够大、足够刚需、也一直向前发展。 当然,这样的机会,竞争也一定大,**但机会来了,先上车,才是最重要的,竞争力是在实战中成长起来的。** 于是,我大概从 26 年元旦后的 1 月中旬,开始开发这个网站,到农历新年的第二天(2 月 18 号),终于开发完成。 ## 二、[PopcornAI Art](https://popcornai.art/) 能做什么: 目前产品包含了以下几个核心功能: ### 1 、参考生视频: 上传参考图(比如一个角色),AI 能保持角色一致性生成视频,适合做 IP 动画或系列内容。 ![参考生视频功能截图](https://i.imgur.com/0lwrhes.png) ### 2 、图生视频: 上传图片生成动态视频,支持多帧参考图引导。 ![图生视频功能截图](https://i.imgur.com/Lvg5pvy.png) ### 3 、文生视频: 输入文字描述直接生成视频,支持 1-10 秒时长,最高 1080P 。 ![文生视频功能截图](https://i.imgur.com/WDM2Xvi.png) ### 4 、图生图: 上传参考图,基于原图生成新图,保持主体一致性。 ![图生图功能截图](https://i.imgur.com/RHva4kU.png) ### 5 、文生图: 基于文字生成高质量图片,支持多种风格。 ![文生图功能截图](https://i.imgur.com/FfaZyx6.png) ### 6 、特效模版: 目前积累了 100+视频模板,涵盖: * Viral Dance ( viral 舞蹈效果) * Product Ads (产品广告) * Cinematic (电影感风格) * Art Styles (艺术风格转换) * Fun Transform (趣味变形) * Holidays (节日主题) * 等 ![特效模版功能截图](https://i.imgur.com/XkPZQbZ.png) ![特效模版功能截图](https://i.imgur.com/632S56m.jpeg) ## 三、一些开发心得: 作为独立开发者,这一个月遇到了一些坑,不过也都解决了,以下是分享几个感悟: ### 1 、奉行 MVP 核心原则 •**先完成再完美:** 中间有小段时间浪费了,也为了解决一些不重要的困难和功能,甚至熬了通宵,但现在回头看来,其实没有太大必要,完全可以先上线,后续再改善:不在上线前追求极致的交互和美化,核心功能实现即可上站,后续根据流量数据再做迭代。 • **控制开发周期:** 这个和上一条呼应:无论产品多大,MVP 开发周期应尽量控制在短时间内(如果非要有个明确的时间的话,我认为对于独立开发者来说,1~2 周就够了)。过长的周期说明需求拆解不够细,或陷入了“过度设计”的深渊。 ### 2 、AI 驱动高效开发 • **充分利用 AI 工具:** 熟练组合使用 Cursor 、Claude Code 、ChatGPT 、Gemini 等工具。和 Gemini 讨论需求,让 ChatGPT 充当架构师和 Code Reviewer ,而 Claude Code 负责具体的执行与 Bug 修复。 • **先沟通再编码:** 最佳流程是先与 AI 深度沟通需求,明确提示词( Prompt )后再让 AI 生成代码,这比直接盲目编码效率更高。 • **利用现成模板:** 对于 0 基础或求快的开发者,直接使用成熟的 SaaS 模板(如集成了 Auth 和 Stripe 的模板)可以避开登录、订阅等复杂技术坑位,这个也是蛮重要的,不要在不重要的事情上,花费过多的时间。 ## 四、想请教大家几个问题: 目前产品刚上线,希望能得到大家的建议,因此想请教大家几个问题: 1 、这个产品你们体验后,有没有觉得不好,想吐槽的地方? 2 、如果你们也是创作者,你们对 AI 视频工具最看重什么?(价格、质量、速度、还是功能丰富度?) 3 、目前产品还有哪些功能你们觉得是刚需但缺失的? 4 、有没有独立开发者朋友,想请教一下产品推广的经验? 我的网站地址是:<https://popcornai.art/> 欢迎试用:[PopcornAI Art](https://popcornai.art/),有任何问题都可以在这里留言,我会认真回复每一条建议。 谢谢!