
https://github.com/AmyangXYZ/MiKaPo
老项目升级新版本,加入了手势和表情控制.
Mediapipe + Next.js + 自己写的 WebGPU 3D 引擎
技术上最难的是怎么把 mediapipe 输出的关键点的三维位置坐标转变为 FK 的骨骼旋转


GistLedger 是一个基于 GitHub Gist 的极简个人记账应用。它利用 GitHub Gist 作为免费、私有的云端数据库,实现数据的安全存储与多端同步。
体验地址: https://gist-ledger.knowsky404.com
🌐 核心理念: Own your data (数据隐私) | Serverless (无后端) | Lightweight (轻量化)
gist 权限。# 1. 克隆项目 git clone https://github.com/KnowSky404/gist-ledger.git cd gist-ledger # 2. 安装依赖 (推荐使用 pnpm) pnpm install # 3. 启动开发服务器 pnpm dev GistLedger-Data 的私有 Gist 和 ledger_data.json 文件。GNU General Public License v3.0 (GPL-3.0)
]]>"if (vocabulary < 5000) return false;"
—— 每个程序员都懂的痛
作为一个程序员,我可以用 Python 写爬虫,用 Javascript 做交互,用 SQL 优化查询。但当我打开 Stack Overflow ,看到**"concurrent"、"asynchronous"、"dependency injection"**这些词时,我的大脑却经常宕机。
这不是智商问题,是方法问题。
传统的背单词方式对我们来说太低效了:
既然我们能用算法优化代码,为什么不能优化记忆?
于是,我开发了一个闲着没事就打开随机学习一个单词的小程序:
微信扫描二维码,开启你的英语进阶之路!因为,优秀的程序员不应该被词汇量限制。

| 学习进度 | 单词释义 |
|---|---|
![]() | ![]() |
用代码改变世界,从记住第一个单词开始。
]]>Vibe Coding 是最近很火的一种编程方式——你告诉 AI 你想要什么功能,AI 来写代码,你只需要 review 和调整方向。不需要亲自敲一行代码,更像是一个产品经理在指挥开发团队。
这款 Clipboard 就是我用这种方式"写"出来的第一个完整项目。
Clipboard 是一款极简的 macOS 剪贴板历史管理工具。核心功能很简单:
⌃⌘V 瞬间呼出历史记录就这么简单。没有复杂的设置,没有花哨的功能,打开就能用。
你有没有过这样的经历:
Clipboard 就是解决这些问题的。它像一个永不丢失的剪贴板,你随时可以翻阅历史记录。
整个过程大致是这样的:
我做的更多是"指挥"和"验收",而不是"编码"。这种感觉很奇妙——你脑子里有想法,AI 帮你把它变成现实。
日常使用起来非常顺畅:
⌃⌘V 呼出面板ESC 关闭或清空搜索没有学习成本,符合直觉。
如果你也想体验一下 Vibe Coding ,或者只是需要一个好用的剪贴板工具,欢迎去 GitHub 看看:
Star 支持一下,让更多人看到这个项目 ❤️
]]>Netstat Cat 是一款 Windows 桌面应用程序,我说白了,就是 netstat 的 GUI 版本 让 网络活动监控 和 应用程序端口查询变得更加简单。 当然,目前是完全开源且免费使用, 有不能满足的需求或者发现 bug ,欢迎提 issue ,🐶
先放 README 链接:Netstat Cat README @Github
再上图:

支持语义化的结构化查询,比如: 
Release 下载地址: https://github.com/XueshiQiao/netstat-cat/releases/
Have fun!
]]>周末花了点时间 vibe coding 了一个 AI 图片生成工具,想分享给大家试用一下,顺便收集点反馈。
周六早上刷推的时候偶然发现了 Flux2 Klein 这个模型,看介绍说是速度极快,就抱着试试看的心态去体验了一下。结果真的惊艳到我了——生成速度不到 1 秒,而且质量也完全能让人接受。
之前一直没有尝试过追新模型(主要是懒),但这次速度实在太诱人了,就想着能不能趁热度做个小工具出来。还好之前做过类似的项目,有些代码可以复用,不然周末真搞不定。
Flux2Klein 是一个基于 Flux2 Klein 9B 模型的 AI 图片生成器,主打速度快和操作简单。

🔗 在线体验: https://flux2klein.io
核心特点:
这是一个典型的套壳产品,技术栈如下:
整个项目从零到上线大概花了一个周末,主要时间花在调 UI 上。之前做过类似的项目,所以很多代码可以复用,不然真的来不及。
如果你愿意的话,帮我试用一下,看看:
有兴趣的朋友可以先去试试: 🔗 https://flux2klein.io
欢迎各种反馈和建议!🙏
]]>
浏览器扩展,能够分析并展示 GitHub 仓库所使用的技术栈。

package.jsonrequirements.txt, pyproject.toml, poetry.lock, uv.lock, environment.yml, Pipfilego.modCargo.tomlpom.xml, build.gradlepackages.config, *.csproj, *.sln, Directory.Packages.propsPackage.swift, Podfile, Cartfile, project.pbxprojCMakeLists.txt, MODULE.bazel, WORKSPACE, xmake.lua, *.vcxprojGitHub: https://github.com/CrankZ/zhan-stack
Chrome Web Store: https://chromewebstore.google.com/detail/kebfbpfgnkegkhmfkkbhgidkjghbleco
前往 Releases 页面,下载最新版本的安装包:
.crx 文件:适用于 Chrome 浏览器的标准安装包。.zip 压缩包:适用于手动加载的源码包。
项目地址: https://github.com/StepfenShawn/kota/
目前还在持续开发中,最终目标是想打造一款用户深度自定义,高性能,小而美的 ai 代码编程工具 欢迎大佬们 star 和提 issue
]]>从登录框的珊瑚蓝渐变,到主面板的好友头像,再到聊天窗口的功能图标,所有素材全部从原版 QQ2006 安装包提取,力求还原最原始的体验。

演示地址: https://lab.ur1.fun/QQ2006/
开源地址: https://github.com/mengkunsoft/QQ2006
20 年前的 QQ2006 ,是很多 80/90 后的数字故乡。那时我们还说着“GG/MM”,攒钱买 Q 秀,为太阳等级熬夜挂机……这个项目不只是 UI 复刻,更是一次怀旧疗愈。
好吧,其实纯为了怀旧&好玩,要说有什么用,还真没什么用……
本项目代码全是业余时间手搓,没有用到 AI ,断断续续做了两周。
如果你对这个项目感兴趣,想一起打造更完整的 QQ2006 复刻版,欢迎提交 PR 或 Issue 。让我们一起为这段数字记忆添砖加瓦!
你可以自由地分享和修改代码,但请保留出处。
让我们一同重温那段青涩时光,用代码致敬经典!
]]>🤔 各位内容创作者,大家有没有过这种“心碎时刻”:精心剪辑了一整晚的视频,发到平台后播放量却平平无奇?或者,你明知道这段视频里的干货足以写出三篇深度好文,但一想到要对着屏幕听写、截图、排版,整个人就瞬间“瘫痪”了?
😫 这种“内容生产力瓶颈”其实是很多人的痛点。视频虽然生动,但搜索引擎抓不住它的“灵魂”;文字虽然利于传播,但手动整理成本太高。那么,有没有一种可能,让我们只做一次视频,就能顺便把博客、公众号和知乎专栏全都“一键填满”?今天,猫头虎就带大家深度测评这款名为 VideoToArticle.org 的效率神器,看看它是如何把“苦力活”变成“魔法”的。✨
正如著名数字营销专家 Neil Patel 曾提到的:“内容创作不是为了生产更多,而是为了让已有的内容发挥更大的价值。” 🌟
在 AIGC 时代,这种“内容重塑( Content Repurposing )”已经不再是奢侈品,而是每一位高效创作者的标配。VideoToArticle.org 正是这一理念的践行者。它通过深度学习模型,精准识别视频中的语义逻辑,将其从线性的视频流转化为结构化的文本流。这不仅是技术的跨越,更是生产关系的重组。📈
讲个身边哥们儿的故事。老王是个数码测评博主,以前只发 B 站,每个视频要做一周。后来他用了 VideoToArticle ,把视频直接转成了深度长文发在个人网站和公众号。结果发现,通过搜索引擎搜过来的精准流量,居然比视频弹幕还热闹!🔥
最夸张的一次,他把一个 15 分钟的科普视频一键转换成了一篇 3000 字的干货文。配合工具自动截取的关键画面( Smart Screenshots ),整篇文章图文并茂,SEO 权重拉满,当天就冲上了相关关键词的搜索首页。这就是“一鱼多吃”的力量!🐋
为什么 VideoToArticle 不是简单的“语音转文字”?这里涉及到一个核心技术:多模态语义分析( Multimodal Semantic Analysis )。核心逻辑分为三步:
体验了一圈,我总结了 VideoToArticle.org 的几个“逆天”特质:
很多人问:AI 会取代创作者吗?猫头虎觉得,AI 只是取代了那些让你感到痛苦的重复劳动。💪
当你不再被“听写视频”困扰时,你才有更多时间去思考选题的深度,去与读者互动,去探索更广阔的创作边界。VideoToArticle.org 缩短了从“想法”到“多平台发布”的距离。这种生产力的跃迁,本质上是把创作者从“搬砖工”变回了“建筑师”。🏗️
总的来说,VideoToArticle.org 不仅仅是一个转录工具,它是一个全方位的内容再造引擎。如果你追求极致的效率,渴望在多平台建立个人影响力,那么这个工具绝对值得你放入收藏夹。记住,在这个 AI 竞速的时代,谁能更早地掌握工具,谁就拥有了竞争的“信息差”。🚀
github 地址:https://github.com/browserwing/browserwing
文档:https://browserwing.com/docs/zh
首先,浏览器的全自动控制是必不可少的,类似 playwright-mcp 跟 agent-browser 。Browserwing 也是开箱即支持 mcp 和 SKILL 两种方式接入你的 agent 。可以自由打开浏览器和抓取内容,点击操作等等。

可以看看:SKILL.md 文件查看其支持的浏览器操作。
比起 playwright-mcp ,browserwing 在一些任务表现会更好,因为他更简洁的压缩页面结构,使得大模型能更好的判断执行。原生支持 skill ,也能更省 token ,节约上下文。
但凡用过 playwright-mcp 等这类自动化工具的同学都知道,这些工具有很大局限,在很多时候执行慢且成功率不高,适合不用精确的也不用追求成功率的场景。但是对于很多需要自动化的场景则很难容忍了。而 Browserwing 的脚本 AI 辅助录制则能帮你解决这个问题。
你可以打开任意网站录制相应的操作,也可以使用 AI 提取结构化数据。然后把对应的操作转为变量,大模型可以调用的时候传入变量来确定具体操作并抓取数据。
脚本的执行稳定性更强,也更精确,速度也更快。你可以很容易将其转为 MCP 。

你可以将几个脚本组合成一个 skill 导出:

如果你怕录制脚本麻烦,别担心,庞大的用户生态,脚本共享,各个平台的脚本将能帮你节省时间,你可以直接上脚本广场去下载复制对应的脚本即可使用。
https://browserwing.com/zh/scripts
感兴趣可以加种子用户群啦,现在快速迭代,基本一天会更新很多功能,可以提前体验。

无一丝人工痕迹
没有一句我自己码的代码
UI 有点像 Surge
没错 就是抄袭的 surge🐶


内测已经结束,免费额度减少,为感谢社区支持,给大家发一个福利:
50 次/天免费翻译额度,有效期 2026 年 12 月 31 日,限额 100 人,兑完为止。
兑换方式:注册网站后,我的-设置-权益兑换

https://translate.cuteslator.com/

吸收了大家的意见,目前已经把浏览器翻译插件做出来,得到了 V2EX 技术同学的帮忙。

https://translate.cuteslator.com/extension
之前一直覺得現在的武俠遊戲畫面越來越好,但自由度卻不如以前的 MUD 或小說。 所以我寫了一個基於 LLM 的後端系統(刀鋒 Blade RPG ),想嘗試做一個「邏輯仿真」的江湖。
最大的特點是 Emergent Gameplay (湧現式玩法) 。我不寫死腳本,而是讓 AI 根據物品屬性和情境去推理結果。
舉兩個實際測試的例子:
傳統遊戲是 A+B=C 的死配方。但在這裡,系統識別的是藥性。

比如這張圖裡,我手裡有止血草、金銀花(清熱)和鹽巴(消炎)。我沒有點擊「製作紅藥水」,而是嘗試將它們混合。AI 後台推演出了「清創生肌湯」。當然,如果你亂配,也可能配出毒藥。
戰鬥結束抓到活口怎麼辦?
如果你的隊伍裡有醫生(吳老頭),系統會允許你使用「針灸或藥物」來逼供(選項 2 );或者你可以玩心理戰,當面救治他的同伴來瓦解他的心理防線(選項 4 )。這些都不是預設的對話樹,而是基於角色能力的動態選項。
雖然是純文字,但為了解決 LLM 的幻覺和 Context Window 限制,我做了不少工程優化。 我寫了一篇詳細的開發日誌,介紹了動態天氣和敘事邏輯的實現細節:
👉 拒絕換皮:為什麼我堅持開發一款「純文字」的 AI 開放世界武俠?
為了測試 Engine 的負載,我給 V 友準備了福利:新註冊直接送 40 輪免費體驗。 歡迎大家來嘗試各種騷操作,把 AI 玩壞也沒關係(請輕噴)。
]]>基于 c 开发,体积只有 86kb ,源码和下载地址: https://github.com/netcaty/ctrl-q
]]>======= function myFunction ======= 这里定义 === 只要大于 3 个就行,多了也不会报错,这样对 AI 改动就友好许多,同时也对人阅读友好。再举一个完整的例子:
======== 函数:计算面积 ========== 输入:长, 宽 输出:长 × 宽 ================================ 关键字支持自然语言同义词:如“输入”也可写作“参数”、“入参”、“arguments”,甚至可以做 i18n 国际化。
例如调用函数这么写:
[任务:发送邮件] 收件人 = user@example.com 主题 = "欢迎加入" 内容 = 从模板"welcome.txt"加载 条件 = 用户状态 == "已注册" 代码语句尽量通俗化:
如果 点击 支付按钮 那么 跳转 支付页 否则 弹出 提示 “请完成支付” ]]>
以前“双城之战 2”的时候买过通行证,为了刷满级,甚至去淘宝买过挂机脚本。
不得不吐槽,LOL 的宝典和通行证每赛季都要肝很久,对我们这种每天 996 的上班族来说,想拿个奖励实在是太累了...
作为一个程序员,直觉告诉我:既然别人能做,那我也可以。 与其把号交给陌生人代练,不如自己写一个“解放双手”的工具。
于是,断断续续花了四个月的心血,我搓出了这个 TFT-Hextech-Helper。

GitHub: https://github.com/WJZ-P/TFT-Hextech-Helper
直链: 点我下载
压缩包解压即可点击 exe 使用。
第一次做完整的 Electron 项目,前后累计花费了我四个多月的心血,希望大家多多点评,点点⭐呀!
希望能帮到同样孤独,或者同样忙碌的你
]]>只需要 pip 一个 mcd 和 httpx 库 
这是一个基于“命运矩阵 (Matrix of Destiny)”体系的数字命理计算器。这个体系在东欧比较流行,结合了数字学和塔罗( 22 大阿卡纳)的概念。
主要解决了以下痛点:
自动化计算:命运矩阵的计算逻辑比较繁琐(涉及多个位置的数字叠加和归约),手算容易出错,这个工具输入生日即可秒出结果。
核心聚焦:专门针对矩阵中最神秘的“业力尾巴 (Karmic Tail)”区域进行了深度解析。
详细解读:目前整理了所有 26 种业力组合(如 18-6-6, 15-20-5 等)的详细含义,以及 22 个能量( Arcana )的解释。
关于技术实现: 前端使用了 Next.js 构建,为了保证加载速度和 SEO ,内容页做了静态化处理。不需要注册登录,完全免费使用。
无论你是对身心灵感兴趣,还是单纯想把这个当作一种性格分析的原型工具来玩,都欢迎体验。
]]>支持全键盘操作,配置快捷键后,可以一键唤出提示词的窗口,唤出后默认会激活搜索,搜索完可按下 tab/enter 进入到卡片区域,可以通过按下方向键和 tab 键进行卡片的切换。
选好后直接按下 enter就可以一键复制提示词,全程双手是可以不用离开键盘的。
鼠标的话就可以点击扩展的图标,就能弹出提示词的窗口,点击卡片就能一键复制。
插件链接: https://github.com/fantasyao/prompt-master/
也是经历了这一次才知道上架 chrome 扩展商店,需要开发者账号,而开发者账号需要 5 美元,算了,舍不得。
]]>特点:
当前还没开源呢,我计划给它增加几个动作,例如切换地图,添加自定义图像,显示文字,播放声音等。
我觉得现在这个 UI 好丑,但是我没有美术功底,期待 V 友反馈哈哈哈。
demo 地址: https://giserlab.cn/app/mapflow/
下面这个很长的是分享链接,进去会有默认动作。
https://giserlab.cn/app/mapflow/?actiOns=NobwRA1gpgnmBcYCGBGAxgBgGwA4AsArALRICceaReARlhkdQMwAmxSaaOAZgYwOxoATNQxgANGAB2SALZQEYQJHagSBVA-criwzKAGc0AJwCWABwAuBgPaSFGkzCPzEXADZwJXA5IPaAFlGYIuJCdtKAlmJBMkBHAnSwQUFFIAOlwMQSwUCScIhEYMFMYcHAxGCSCTXJK6MIBXPQiLK3gCAF8WsXBoOERGNAJmPKw+IgJ+riouQVIiUhRmPCIhUkFAjDxewRwNaTkFQHRlQEW5QC5lDS1dQ1NG6wlbewVnVzB3Tx8-AKCQsIio+Bi4+BQghQSXweDomTA2Qq8CmINIpAIeBwZSc0JQvFIGFq9TM-z4bQ6kFgCkxeC4gUEjCIGGY1EoeAoxHI8yIuDJaCwWGEaCg1G2sgcYEAF3aAfRsTmEdPpjLimmAbHZBQ8NM8vL5-PBAsFQppvtFIf9AfkgYkcBCoZUkoIMDhGIxBCjoQQMM6sZo6g1-lgCZ1iYgihg+KMkOMMARMFQ+FAmVw6VREaNbRgkHwEvzdohReLNJKLjKFIBVv0AexmZ+V3RBIPTmGqSfxuDyqt4aj7a8KRPWxJqGy0JUimrI5eB5S3W2325CohBW12+AwAc28aJdrvqklnDidzokRgMJjQ3gQcexHs7gm9RO6YDwKCwtIySCopCwCzwtPopGYHKI+GoKD4jBQJSUqQaaCoAs0GAOrK6gSuc0pXIgpaKi4yr1q86qap8Optr8+onvkeCCAQCJ8P20KCHwSQECgOBYIwWBHnm8CkA6CCcgBZ5dAoUBIJyUB8GSRBQLR9KRlADA8oIRBaOQnJWowUBYAQIEKIAHHqAI46UHZjBlz-HKNwKvcSF1i8arvFqXxYX8nZURRCSCIIeAkZOOBJJi9lgvRcGAsx8D4Rg7G+k8BBIOwf4LHwVRUPwlA4KQUAoNSgjMEC1B8FwWBINQikSDsgqALhKgDTmoAY5GAH9qpw5rBOkIQZjwqqhpkYa2PyWfEVpJCayyOYORoEHwRQeZ63kEXQS5tAAukAA ]]>ffl 上一篇传送门。 这阵子在维运时遇到一个痛点:「想分析 Production 容器里的 Nginx Log ,但不想在 Server 上装 GoAccess ,也不想把几百 MB 的 Log 载回来占空间。」
通常大家会用 scp 下载,或者搞复杂的 SSH Tunnel 。但我个人还是感觉有点麻烦,尤其是档案在 Container 内 或属于 Root 权限 时,SFTP/SCP 很难直接一把抓出来。
于是就有了这个玩法的 Demo 。👇
(影片示范的是将远端 160MB 的 Log 直接串流到本地 GoAccess 进行即时分析)
Server 端零洁癖 (Zero Dependencies) 因为是用 APE 封装,不用装 Python 、不用装 Node ,甚至不用管 OS 版本( Alpine/Debian/CentOS/x86/ARM 通吃)。直接 curl 下来就能跑,跑完就删,不弄脏环境。
即时且节省空间 资料不落地。流程变成:Remote Stream -> Local Pipe ,流量走完就结束了,不会占用本地硬碟。当然你想存下来也可以,连结丢进浏览器下载走的是 WebRTC P2P ,速度也是非常快。
穿透内网 如果你的 Server 在层层 NAT 后面,或者你只是想把 Log 分享给没有 SSH 权限的同事看,这个连结丢给他,浏览器打开也能收(会走 P2P 传输)。
1. 远端 (Producer): 把 Log 吐出来,Pipe 给 ffl:
# 下载 (APE 格式,单一 binary) curl -fL [https://fastfilelink.com/ffl.com]( https://fastfilelink.com/ffl.com) -o ffl.com && chmod +x ffl.com # 把档案变连结 (资料夹也可) ./ffl.com /var/log/nginx/access.log 2. 本地 (Consumer): 拿到连结后,用 curl 接住并喂给 GoAccess:
curl -sN [LINK] | goaccess - --log-format=COMBINED 🔗 专案地址
如果你也是 CLI / APE 爱好者,欢迎来 GitHub 看看,也欢迎 Star 或 PR ! 👉 https://github.com/nuwainfo/ffl
目前正在尝试更多 stdin 的玩法(例如 mysqldump 异地备份),有什么脑洞大开的用法也欢迎交流!
]]>起了个大早,赶了个晚集,早就买了域名上了个简单页面,一直没有优化宣传。
登录就送点数,大家可以来玩,生成人物的效果很不错。
]]>最近一个月很热衷于 nano banana 文生图 的效果,看各位国内外大神们的各种提示词调整 nano banana 生成图片的效果,但是苦于经常看了又忘,有代码、有图片不好整理,所以就想着干脆搞个网站收录一下。
-- 其实,刚开始的时候,想着干脆用 wordpress 或者更简单的 typecho 搭建一下算了,可这俩有点玩腻歪了,而且之前买的国外服务器已经过期不想续费了,国内的服务器还得备案。
-- 所以,趁着 AI 的东风,看看是否可以通过 AI 生成网站部署到 github 或者 cloudflare 上。 而且正好无意间发现了 AnyGen 这个代码生成平台,试了一下几个静态网页,效果不错。而且介绍了两个哥们注册、送了一个月 Pro ,心想可能能成。
-- 1 、构思域名,围绕 Prompt (提示词) 组合反复查询是否可以注册,最后选定了域名:promptwisp.com ,意思就是“像烟一样的一缕提示词”,尴尬。就它吧!
-- 2 、注册域名,本来想在 cloudflare 注册,后来选择了 阿里云,主要是方便统一管理。
-- 3 、在 AnyGen 上输入提示词进行搭建,这个过程就是反复的输入、预览、修改。
-- 4 、在 AnyGen 看到预览效果差不多的时候,告诉 AnyGen 需要部署在 GitHub Pages 上,而且需要方便新增维护(主要是新增 AI 提示词、对应的效果图),让 AnyGen 生成直接用于部署的 zip 文件压缩包。
-- 5 、GitHub 上创建 Pages 、绑定域名、上传文件。
-- 6 、其他魔改:放上了 Google Adsense 、添加了 Stripe Donate 按钮。主要是为了测试一下完整的工作流。
-- 对于我这种不会 coding 、想法很多的人来说,AI 提供了极大的便利,有一些“另辟蹊径”的满足感。
-- 准确的告诉 AI 如何做、给 AI 一份 PRD 文档,对于我来说,AI 能替代一个初级程序员朋友/同事。
-- AI 生成网站代码 https://www.anygen.io/
-- 网站代码部署 https://github.com/
-- 效果预览 https://promptwisp.com/
]]>还在为网站顶部的促销横幅反复打开 PS 、调整尺寸和排版吗?
传统的手工设计不仅耗时,还很难快速迭代不同活动场景。
现在,只需一句描述,就能让 AI 自动帮你完成一切。
让设计不再成为阻碍,让创意立刻上线。
输入文字,AI 出图,马上用。
产品体验地址: 专业横幅生成器.
]]>而且体验比起 Termius 还是差很多
可能适合的人:
主要特性:
其实也不是什么灵感,就是自己用 Final Cut Pro 用多了。一直搞不懂为什么果子不做一个字幕识别的功能出来。哪怕收费的也可以啊。
市面上的字幕识别软件也有,例如 Arc Time ,剪映,讯飞等。但他们一般只导出 srt 文件。
而 srt 文件导入到 FCP 后,作为字幕组件,FCP 竟然不支持调整样式,难顶。

所以最后自己搞了个字幕识别的 Mac App (因为要用到离线识别,所以只能用 Mac App 了)。
下载体验地址: https://video-caption.site/
文章最后写了一下在开发这款 App 的一些感想,想了解的可以直接拉到最后~
使用 Whisper 模型的能力来进行音频转文本。
效果一般般,只能说到能说,但肯定无法直接媲美剪映。同时 Whisper 需要用到本地计算资源,所以识别的速度取决于电脑性能。当然,如果只识别几分钟的视频,而且用个基础的 base 模型,速度还是够用的。

因为离线能力一般般,所以就顺手加上了在线识别功能。当然,我觉得各大平台和软件都有了,甚至做得应该比我好,我只是额外提供一下在线识别能力,用的是剪映同款的火山引擎音频识别。
因为这里要调 API ,所以不可避免要收费,不过,我觉得目前定价 10 分钟视频就 1 块,应该还好?一年 48 周,一周一条视频,也不超过 50 块。
因为要做收费,所以也得做个登录功能来给大家记账。为了方便大家,这里用的是微信登录,并不是想单独整活。

目前提供了导出为 SRT 文件,以及生成 fcpxml 文件。选择“导入 FCP”后,会自动生成 fcpxml 文件,同时导入字幕项目。每条字幕在 FCP 里就是一个标题。
后面大家就可以批量针对字幕进行样式调整了。

调整好样式后,可以把当前字幕项目“新建复合片段”,在 FCP 里变成一条新素材,再复制到你自己的项目里就 OK 。

P.S. 所以可能出现导入后看不到字幕的情况,这是因为 FXP 字幕默认是黑色的,可以在背后加个背景或者加到自己的项目中就能看到了。
还有一些我自己想的,方便大家的功能:

当做完这个 App 的时候真的很感慨 AI 的能力竟然如此强大。我自己是个前端程序员,并无任何客户端开发能力。可以说整个项目我都没怎么写过代码。全靠 cursor 开发。
以前的我也属于那种”守旧派“,觉得别人一直在吹 AI ,我偏要做”众人皆醉,我独醒“的那个人。用一个电影来举例就是《我,机器人》里的那个警探。一方面面临 AI 随时能替代我这样的”页面仔“的恐惧,另一方面又因为厌恶它们对职场的冲击,而不愿意使用或者信任它们。仿佛我极不情愿地被 AI 时代推着往前走的感觉。
但当我越来越使用 cursor 去实现的时候,我的态度开始转变,就像那位警探一样。从最初的不信任,到把它变成工具,现在我自己对它的感情就像是我的虚拟同事一样。有的时候真的会被 AI 整难受,骂了它一个早上...
当然,我不是那种吹嘘”AI 就能搞定的“那类人。因为在做这个 App 的时候,我依然跟 Cursor 聊了 1-2 个月(当然是下班闲着的时间了),才聊出来的。所以,我并不认可那些”全给 AI 做,很快就搞定“的言论。AI 是可以提速,但依然有很多问题需要自己面对:
实际上 AI 确实只是工具,拼到底的是执行能力以及解决问题的能力。在做这个 App 时,我也遇到了很多需要人为解决的问题:
可以看到,以上这类问题根本无法用 AI 100% 帮你解决,你要做的就是去学习,重新思考,执行,落地。这也是我想表达的:拼到底的是执行能力以及解决问题的能力。
感想写了好多(非 AI ),大家可以酌情看看,路过方便也可以体验一下 App 哈哈。
]]>一、网站核心定位 该网站以 “Base64 技术生态” 为核心,兼具 “知识科普” 与 “实用工具” 双重属性:
知识传递:系统梳理 Base64 的基础原理、字符表、编码逻辑等核心知识,帮助用户理解编解码本质,而非仅停留在 “工具使用” 层面; 工具服务:提供在线编解码工具,覆盖 Base64 及多种衍生编码格式(如 Base16 、Base32 等),支持 “文本 - 编码”“图片 - Base64” 等高频场景转换; 多语言支持:针对主流编程语言( Java 、Python 、Javascript 等)提供 Base64 实现方案,方便开发者直接在项目中集成编解码功能,降低开发成本。 二、导航及功能模块详细拆解 从文档中呈现的内容来看,网站导航及功能模块可分为 Base64 核心知识区、在线编解码工具区、多语言实现区、衍生编码格式区 四大类,每类包含多个细分板块,具体如下:
(一) Base64 核心知识区:理解技术本质 该区域聚焦 Base64 的基础理论,帮助用户建立对编解码技术的认知,包含以下模块:
Base64 Principle ( Base64 原理) 核心内容:讲解 Base64 编解码的底层逻辑,包括 “每 3 字节拆分为 4 个 6 比特单元”“不足 3 字节时的填充规则(补 0 与 = 符号使用)” 等核心原理,结合索引表( A-Za-z0-9+/)说明字符映射关系; 价值:为用户解释 “Base64 为何能将二进制数据转为可打印字符”,避免仅会用工具却不懂原理的问题。 Base64 Fundamentals ( Base64 基础) 核心内容:涵盖 Base64 的定义(非加密技术,仅为数据格式转换)、应用场景(如邮件附件编码、网页图片内嵌)、编码后数据长度变化(原始数据的 4/3 倍,向上取整)等基础知识点; 补充:可能包含 “Base64 与加密的区别”“为何不能用于数据安全保护” 等常见误区解读,帮助用户正确认知技术边界。 Base64 相关表格资源 base64 table ( Base64 字符表):展示 64 个可打印字符与索引值( 0-63 )的对应关系,例如 A 对应 0 、Z 对应 25 、a 对应 26 、0 对应 52 、+ 对应 62 、/ 对应 63 ,是理解编码映射的核心参考; Base64 Encoding Comparison Table ( Base64 编码对比表):可能对比 “标准 Base64” 与 “URL 安全 Base64”(如将 + 替换为 -、/ 替换为 _)、“MIME 格式 Base64”(每行 76 字符加回车换行)的差异,明确不同场景下的编码选择; Online Base64 Encoding Comparison Table (在线 Base64 编码对比表):提供交互式对比功能,用户可输入原始文本,实时查看不同 Base64 变种的编码结果,直观理解差异(如输入 “cat”,标准编码为 Y2F0 ,URL 安全编码可能为 Y2F0 或无差异,需结合具体实现)。 (二)在线编解码工具区:满足即时转换需求 该区域是网站的 “实用功能核心”,提供无需下载、开箱即用的在线工具,覆盖 Base64 及图片相关的高频转换场景:
Base64 Encode/Decode ( Base64 编码 / 解码) 基础功能:支持文本与 Base64 字符串的双向转换,用户输入文本(如 “Hello World”)可实时生成编码结果( SGVsbG8gV29ybGQ=),输入编码字符串可反向解码为原始内容; 进阶功能:可能包含 “字符集选择”(如 UTF-8 、GBK ),解决中文等非 ASCII 字符编解码乱码问题;支持 “批量处理” 或 “清除空格 / 换行” 等预处理功能,提升转换准确性。 Image 与 Base64 互转工具
Image to Base64 (图片转 Base64 ): 功能:用户上传本地图片(支持 JPG 、PNG 、GIF 等常见格式),工具自动将图片二进制数据转为 Base64 字符串,生成可直接嵌入网页的 data URI 格式(如 data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAA...); 场景价值:适用于 “小型图片内嵌网页” 场景,减少 HTTP 请求次数(如图标、头像),提升页面加载速度。 base64 to Image ( Base64 转图片): 功能:用户输入 Base64 编码字符串(需包含完整 data URI 或纯编码内容),工具反向解析为图片并支持预览、下载; 场景价值:用于验证 “图片 Base64 编码是否正确”,或从编码字符串中恢复原始图片(如从接口返回的 Base64 数据中提取图片)。 (三)衍生编码格式区:覆盖多场景需求 除 Base64 外,网站还提供多种 “Base 系列” 编码的工具支持,满足不同场景下的编解码需求,具体如下:
编码格式 核心功能 应用场景 Base16 在线编码 / 解码( Online Base16 Encode/Decode ),基于 16 个字符( 0-9 、A-F ),将二进制数据按每 4 比特拆分为 1 个单元,1 字节对应 2 个 Base16 字符 用于表示十六进制数据(如哈希值、证书指纹),可读性高于纯二进制 Base32 在线编码 / 解码( Online Base32 Encode/Decode ),基于 32 个字符( A-Z 、2-7 ),每 5 比特为 1 个单元,避免大小写混淆(无小写字母) 适用于 “人工输入场景”(如密钥、验证码),减少输入错误(如区分 O 与 0 ) Base58 在线编码 / 解码( Online Base58 Encode/Decode ),去除 Base64 中易混淆的字符( 0 、O 、I 、l ),保留 58 个字符,无特殊符号 区块链领域常用(如比特币地址),兼顾简洁性与防混淆 Base62 在线编码 / 解码( Online Base62 Encode/Decode ),基于 62 个字符( A-Z 、a-z 、0-9 ),无特殊符号(去除 Base64 的 +、/) 适用于 “不支持特殊符号的场景”(如 URL 参数、文件名),避免转义问题 Base85 在线编码 / 解码( Online Base85 Encode/Decode ),基于 85 个可打印字符,压缩率高于 Base64 ( 4 字节对应 5 个 Base85 字符,Base64 需 6 个) 用于需要高压缩率的场景(如 PDF 内嵌数据、大型文件传输) Base100 在线编码 / 解码( Online Base100 Encode/Decode ),基于 Unicode 字符,1 个 Base100 字符对应 1 个字节,压缩率极高 适用于 Unicode 兼容场景(如文本文件加密后编码),但兼容性较低 Custom Base64 (自定义 Base64 ) 在线自定义编码 / 解码( Online Custom Base64 Encode/Decode ),支持用户自定义 64 个映射字符(替换标准的 A-Za-z0-9+/),生成符合特定规则的编码结果 满足特殊场景需求(如内部系统数据传输、自定义协议),提升数据辨识度 (四)多语言实现区:助力开发集成 该区域针对主流编程语言,提供 Base64 编解码的实现方案、模块介绍及在线示例,方便开发者直接在项目中使用,具体如下:
Java Base64 内容:介绍 JDK 内置的 java.util.Base64 类(支持标准、URL 安全、MIME 三种模式),提供代码示例(如 Base64.getEncoder().encodeToString("data".getBytes())); 在线支持:可能提供 “在线 Java Base64 代码运行” 功能,用户输入代码片段可实时查看编码 / 解码结果,验证逻辑正确性。 Python base64 内容:讲解 Python 内置 base64 模块的使用,包括 b64encode()(编码)、b64decode()(解码)方法,说明 “需先将字符串转为字节流( bytes )” 的注意事项; 在线支持:提供在线代码编辑器,用户可输入 import base64; print(base64.b64encode(b"Hello").decode()) 等代码,实时运行并查看结果(如输出 SGVsbG8=)。 Javascript Base64 内容:覆盖浏览器环境( btoa() 编码、atob() 解码,需处理 Unicode 字符)与 Node.js 环境( Buffer.from("data").toString("base64"))的实现差异; 在线支持:提供在线 JS 运行环境,用户可输入前端或 Node.js 代码,验证不同环境下的编解码结果(如解决中文编码乱码问题)。 Go Base64 内容:介绍 Go 标准库 encoding/base64 的使用,包括 base64.StdEncoding.EncodeToString()(标准编码)、base64.URLEncoding ( URL 安全编码)等; 在线支持:提供 Go 代码在线运行示例,帮助开发者快速集成(如接口请求中对参数进行 Base64 编码)。 Rust Base64 内容:讲解 Rust 第三方库(如 base64 crate )的使用,包括依赖引入、编码 / 解码函数调用,说明 Rust 中 “字节切片(&[u8])” 与字符串的转换逻辑; 在线支持:提供 Rust 代码片段及运行结果预览,降低新手使用门槛。 Ruby Base64 内容:介绍 Ruby 内置 Base64 模块的 encode64()、decode64() 方法,说明 “默认包含换行符(每 60 字符)” 的特性及关闭方式; 在线支持:提供在线 Ruby 代码运行工具,验证编码结果是否符合预期。 其他场景实现 APP Base64:覆盖 Android (如 android.util.Base64 类)与 iOS (如 NSData 的 base64EncodedString() 方法)的移动端实现,提供原生代码示例; SQL Base64:讲解数据库层面的 Base64 编解码(如 MySQL 的 TO_BASE64()、FROM_BASE64() 函数),支持在 SQL 语句中直接处理编码数据(如查询时解码存储的 Base64 字符串); 在线支持:提供 SQL 语句示例及运行结果(如 SELECT TO_BASE64('test') 输出 dGVzdA==),方便数据库运维人员使用。 三、网站核心优势总结 一站式资源:从 “原理学习” 到 “工具使用” 再到 “开发集成”,覆盖 Base64 全链路需求,无需跳转多个平台; 场景化覆盖:不仅支持标准 Base64 ,还提供 Base16/32/58 等衍生格式及多语言实现,满足不同行业(如区块链、网页开发、数据库)的细分需求; 易用性强:在线工具无需注册、下载,即时输入即时出结果;知识内容通俗易懂,结合示例降低理解门槛; 实用性高:图片与 Base64 互转、URL 安全编码等工具直接对接实际开发场景,可直接提升工作效率。
]]>免费批量套版网站,傻瓜式操作,快速实现电商图批量套版,电商效果预览图和纸样图都可以生成。

事情还要从上个月( 12 月 4 号)说起。当时我在技术群里求助,吐槽 Mac 总是莫名其妙自动切换回它自己的自带输入法,非常打断心流。 当时的聊天截图如下,群里大佬给出的“硬核”建议是——“卸载自带输入法” 😂

玩笑归玩笑,我想了一下原理,其实通过监听 APP 的焦点切换事件,应该就能实现自动化切换。 虽然之前学过 Flutter 和 Swift ,本来打算自己手搓一个。但转念一想,现在 AI 既然都这么努力了,为什么不试试让 AI 帮我写呢? 反正我自己能看懂代码,逻辑把控住,不至于写出失控的代码。 于是,在 AI 的辅助下,在这个周末搓出了这个小工具。
工具做出来后,想着“来都来了”,不如顺手加点 Pro 功能,申请了支付接口,试试能不能赚赚刀乐? 然后火速上官网,就放着没管了。
讲真,咱也不知道这破玩意儿到底有没有人用,更别说下单买 Pro 了 —— 甚至我自己都一直在用 Free 版本 😂
直到前些天,突然收到了支付平台的用户支付邮件。
Ohhh~!不仅有人用!还有人愿意为它买单!
既然验证了需求,就发出来给 V 友们送一波终身码。 生成了 100 个 Pro 版终身会员兑换码,希望能帮到同样被输入法折磨的 hxd 。
优惠码:JA4Y056FBC
使用方式:点击官网的 [购买 Pro] 跳转支付页面后,填写折扣码就 OK~不需要填写支付卡等信息,拿了的 xdm 留个言反馈反馈呀~
]]>今天开启限免,3 天内 0 元领终身会员,无内购套路。
但求五星⭐️⭐️⭐️⭐️⭐️鼓励
码,实在发不过来了😂😂😂
功能主要分四个 Tab ,外加一些我个人很在意的特色细节:
主打 实时压力监测。聚合了 HealthKit 的生理数据,直接计算并展示你当下的压力值,顺带展示步态、噪音等底层数据。抬腕即看,比原生更直观。

对历史健康数据做可视化。用 SpriteKit 做了 压力热力图,一眼看出这周哪天压力大。还有睡眠月相图和 ECG 分析。

番茄钟、饮水记录、咖啡因追踪等量化工具的集合。

这是最核心的功能,在手表上做了一套 文件管理器。

精心设计的实用表盘,将关键信息以最美观的方式呈现在手腕上。

全屏时钟 + 状态监测(防尴尬版) 提供全屏翻页时钟,同时实时显示压力与专注度评估。
特别说明:为了方便大家在公司或自习室挂机使用,我特意设计了 积极向的提示文案。即便状态不佳,也只会显示正向引导,绝不会弹出“你走神了”这种让人尴尬的负面评价。
(注:该功能为横屏全屏显示) 
私密健康 + 隐私锁 关注一些重要但私密的指标:内置 性健康管理 与 凯格尔运动 训练辅助。
这部分数据默认开启 FaceID 隐私保护,只有通过生物识别验证才能查看,把秘密留在手腕里。
⬇️ App Store 下载
觉得好用给个好评,有 Bug 评论区反馈,我会修。
]]>33 字幕的目标是希望成为新一代最好用的 AI 字幕生产力工具之一。
产品地址:33 字幕
经过近一月的开发,33 字幕在线功能已经初步完善:
视频加字幕: 智能识别音视频内容,一键生成精准的双语字幕,自动对齐时间轴。
AI 翻译字幕: 基于大语言模型深度理解语境,提供媲美人工精翻的多语种字幕体验。
AI 转逐字稿: 自动区分不同发言人,精准转写会议记录与访谈录音,支持智能分段。
播客转文稿: 输入链接,轻松提取播客和视频文稿,支持小宇宙、B 站、小红书。
在语言支持上,我们支持中文、英语、粤语、日语、韩语等 90+ 种语言的识别与互译。
在生成 AI 字幕上,除了使用精度最优的识别模型,我们还自研了智能断句算法,确保每行字幕长度合理、断点自然,观看体验更流畅:

在字幕翻译上,33 字幕摒弃了 DeepL 这类传统的机器翻译,拥抱大语言模型,让翻译效果媲美人工翻译。
大家知道,使用大模型翻译效果好,但即便使用最高级的模型,目前也无法完全避免输出不稳定,格式错乱的问题,我们使用了严格的校验和重试机制,来让这个问题获得完美解决。

通过 33 字幕,还可以非常方便把小宇宙| B 站|小红书的音视频内容,直接一键转成可读性非常好的文稿,这里的核心技术是也语音转写+大模型后优化处理。

算力兑换码(请领取的朋友记得留言,方便其他人知道,如果用完还有人需要我会补充):
兑换方式:

未来除了不断完善在线服务,还会基于开源模型,把 33 字幕客户端做成一个完全免费的离线版本,大家可以期待一下。
如果有任何产品上的建议,也欢迎大家提出。
]]>1.群晖 NAS 管理
2.Emby 观影
3.Audiobookshelf 听书
4.AudioStation 听音乐
5.Navidrome 听音乐
6.WebDAV 文件管理
废话不多说,直接上图~

有兴趣的小伙伴们可以在这里下载体验 DS One 安卓下载地址 DS Cloud iOS 下载地址
]]>完全依赖于逻辑推理,玩家可以完全通过分析来找到每个地雷的位置,而不需要依赖运气。每一局都是 100%可解的,解决方案是独一无二的。
开始摸鱼
]]>如何实现这个?我已知或已有的条件如下:
我解释一些,防止朋友们误解:
采用全屏强提醒,让你久坐电脑前工作时保持身体健康:


首发 V2EX ,希望领取优惠码的朋友们在 App Store 留个五🌟好评,感谢🙏
直达安装: https://apps.apple.com/cn/app/heybody/id6757629569?mt=12
MNEKJ3RRLR63 TTT7E7A3TJ96 X4R3HW3NXL9X NPAKJN6LN79E NTXYW3R6MP9H NJ3FEEPPY9NW L77R6NJ6L3HW MELLMMALNNMM XJKJEJP4J7P6 AJ34RLL9LXME NJNEAAJLNKJN NHMM7RAJXHY6 NRE4M6XJ9H7T 4NYHEMW3AAH4 YLANKL4JX7MR FY9E6TPLRW4A E9A4LPLETYXY TYA6L3J3HP6K 7P9NWHHAHJE3 99MP4RELJNJF ]]>如果你和我一样,也是 Macbook 8G 内存的受害者,那就试试 MemoryBubble 内存占用可视化和清理 App 吧
用气泡模式直观展示内存占用大户,双击泡泡即可 kill 进程释放内存

或者使用传统的进程树模式,可以看到父子进程关系,找到罪魁祸首

0 元购优惠码(50 次):MEMORYBUBBLEVIP,网站登录后点击升级会员,在支付页面填写优惠券即可