科技最前沿

本文最后更新于 2025年12月7日 下午

旧时王谢堂前燕,飞入寻常百姓家

正版特惠 数码荔枝®长期优惠码 DMUCD95

月租19元192G流量卡 DMUCD软件库v3 Pro

文档描述

  • 本文记录了一些技术教程及前沿科技相关信息
  • 建议在 PC 端打开博客文章,可显示目录(TOC)

01. 大语言模型卷

国外主流 LLM:Microsoft CopilotChatGPTClaudeGeminiGrokLlama [CN]

大模型 API 获取:火山方舟阿里云百炼魔塔社区SiliconFlowServerless API

Cursor:集成了 LLM 的类 vscode 的 AI 辅助编程助手 [免费续杯],同类的 Trae 简洁易懂好上手

AI 写作助手:帮助用户组织写作风格提示词,并通过 LLM 生成高质量内容

02. 图像处理AI集

2.1 开箱即用

通过指令让 AI 进行文字​生成​图像、生成式填充、图像补全、背景移除、对象消除等快捷 PS 操作

2.2 以文生图

获取 AI 模型整合包:@秋葉aaaki@万能君的软件库

  • 结合手绘内容以文生图:DynamicImgPilotDrawfast (基于LCM模型
  • Flux.1:Stable Diffusion 原始团队推出的文生图模型套件(效果远超 SD 3 及 MJ v6)[1] [2]
  • Fooocus:AI 画图工具,结合了 Stable Diffusion 和 Midjourney 的优点,开箱即用
  • Invoke AI:用于 Stable Diffusion 等模型的AI绘画可视化工具 [52]

2.3 P图的 AI

2.4 大厂专区

腾讯ARC(Applied Research Center)

  1. GFPGAN:老照片人脸修复、着色
  2. PhotoMaker:基于上传的人像生成各种风格的逼真照片
  3. T2I-Adapter:基于手绘内容与文本描述生成图片

03. 音视频模型区

3.1 直接上手

3.2 视频换脸

3.3 音声合成

3.4 剪辑后期

Subtitle Hub:影视字幕工具一站式导航平台

04. 优秀开源游戏

4.1 棋类引擎

Andriod 阿Q围棋 Lite象棋巫师棋路-中国象棋

4.2 其他游戏

  • Unciv:“文明5”的低配版像素游戏 <100MB
  • Habitica:完成你的待办事项后,会升级解锁更多游戏玩法
  • CorsixTH:Theme Hospital 游戏的开源复刻版

05. 实用开源工具

原则上,现在的手机选择 arm64-v8a 版本架构;虚拟机选择 x86_64x86 架构;一些比较旧的手机,选择armeabi-v7a [1] [2]

5.1 功能软件

OP Auto Clicker:鼠标自动点击工具,同时支持 PC 与 Android

MyKeymap:一款基于 AutoHotkey 的键盘映射工具 [1]

5.2 娱乐软件

06. 第三方客户端

解锁本地会员权限,如去广告、离线下载等

07. 语音文字转换

7.1 文字转语音

电子书转有声读物

7.2 语音转文字

开箱即用:Whisper飞书妙记剪映通议听悟音视频取文本工具(带时间轴)

  • FunASR:阿里达摩院的语音识别工具包,结合了语音端点检测、语音识别、标点预测、时间戳预测、说话人区分等模型 [CapsWriter] [蛐蛐 (QuQu)]
  • zh_recogn:将音频或视频中的中文语音识别并导出为 srt 字幕,基于魔塔社区 Paraformer 模型
  • AsrTools:智能语音转字幕文本工具,内置大厂 ASR 服务,无需 GPU 和繁琐的本地配置,小白也能轻松使用🎯
  • WhisperLiveKit:支持低延迟本地实时语音转写、多语言翻译和说话人分离功能

08. GitHub收集盒

8.1 人工智能

国内外大模型综合性多维度中文能力评测榜单:CLiBSuperCLUE

开源大模型食用指南:围绕开源大模型、针对国内初学者、基于 Linux 平台的中国宝宝专属大模型教程

8.2 应用软件

8.3 其他收集

音源 LX/小说源 Legado/视频源 Zyfun/直播源 IPTV/图源

09. 技术极客论坛

BL List:各大手机厂商的 Bootloader 解锁、内核开源、保修政策对比

最新动态

  • 想要及时查看 DMUCD 的更新内容请移步 小红书

科技最前沿
https://dmucd.github.io/posts/773cbcea
作者
阿岩
发布于
2022年7月2日
许可协议