科技最前沿

本文最后更新于 2025年3月4日 上午

旧时王谢堂前燕,飞入寻常百姓家

正版特惠 数码荔枝®长期优惠码 DMUCD95

每月19元192G流量卡 破解软件资源猎手V3.0

文档描述

  • 本文记录了一些技术教程及前沿科技相关信息
  • 建议在 PC 端打开博客文章,可显示目录(TOC)

01. 大语言模型

国外主流 LLM:Microsoft CopilotChatGPTClaudeGeminiRekaLlama [CN]

SiliconFlow:基于华为云 × DeepSeek 的大模型云服务平台,提供免费和付费 API 🎯

Serverless API:Gitee AI 的大模型 API 服务资源包 [指南]

Cursor:集成了 LLM 的类 vscode 的 AI 辅助编程助手

02. 图像处理AI集

2.1 开箱即用

可以直接上手的在线 or 离线生成​式 AI 工具

  • 📌Recraft:通过文本描述生成位图(Raster)与矢量图(Vector),可上传图像自定义风格;同时支持生成式填充、去除/改变背景、区域消除、图形拼接等
  • IOPaint:擦除、修改/替换、添加新对象、图形补全(外画)等,可离线使用
  • ClipdropStable Diffusion 旗下工具,支持文字​生成​图像、生成式填充、图像补全、背景移除、对象消除、草图转真实图等
  • Microsoft Designer:支持以文生图、去除背景、消除对象、改变图像风格等
  • Adobe Firefly:文字​生成​图像、生成式填充、生成矢量图、重新着色等 [去水印]
  • Image-fxGoogle 的以文生图模型

2.2 以文生图

获取 AI 模型整合包:@秋葉aaaki@万能君的软件库

  • 结合手绘内容以文生图:DynamicImgPilotDrawfast (基于LCM模型
  • Flux.1:Stable Diffusion 原始团队推出的文生图模型套件(效果远超 SD 3 及 MJ v6)[1] [2]
  • Fooocus:AI 画图工具,结合了 Stable Diffusion 和 Midjourney 的优点,开箱即用
  • Invoke AI:用于 Stable Diffusion 等模型的AI绘画可视化工具 [52]

2.3 P图的 AI

  • AI 抠图模型:U2-Net飞桨ReplaceAnythingBackground RemoverPBRem ToolTransparent Background
  • IOPaint:全能图像工具箱,支持图像消除、对象替换、文字绘制和图像扩展等 [52]
  • AnyText:在图像中修改或生成高度融合的文本
  • DeepMosaics:自动去除图像和视频中的马赛克,同时支持添加马赛克
  • Edit Anything:编辑和生成图像中的任何内容
  • LiYing:证件照后期自动处理程序,可以完成人体、人脸自动识别,角度自动纠正,自动更换任意背景色,任意尺寸证件照自动裁切,并自动排版
  • HivisionIDPhotos:轻量级证件照AI,支持抠图、生成不同尺寸的标准证件照、六寸排版照、美颜、智能换正装
  • Text Behind Image:在图像主体背后添加文本

2.4 大厂专区

腾讯ARC(Applied Research Center)

  1. GFPGAN:老照片人脸修复、着色
  2. PhotoMaker:基于上传的人像生成各种风格的逼真照片
  3. T2I-Adapter:基于手绘内容与文本描述生成图片

03. 音视频模型区

3.1 视频换脸

3.2 音声合成

3.3 直接上手

04. 优秀开源游戏

4.1 棋类引擎

4.2 其他游戏

  • Unciv:“文明5”的低配版像素游戏 <100MB
  • Habitica:完成你的待办事项后,会升级解锁更多游戏玩法
  • CorsixTH:Theme Hospital 游戏的开源复刻版

05. 实用开源工具

原则上,现在的手机选择 arm64-v8a 版本架构;虚拟机选择 x86_64x86 架构;一些比较旧的手机,选择armeabi-v7a [1] [2]

5.1 功能软件

5.2 娱乐软件

06. 第三方客户端

解锁本地会员权限,如去广告、离线下载等

07. 语音文字转换

7.1 文字转语音

电子书转有声读物

7.2 语音转文字

  • 开箱即用:Whisper飞书妙记剪映通议听悟音视频取文本工具(带时间轴)
  • FunASR:阿里达摩院的语音识别工具包,结合了语音端点检测、语音识别、标点预测、时间戳预测、说话人区分等模型 [CapsWriter]
  • zh_recogn:将音频或视频中的中文语音识别并导出为 srt 字幕,基于魔塔社区 Paraformer 模型
  • AsrTools:智能语音转字幕文本工具,内置大厂 ASR 服务,无需 GPU 和繁琐的本地配置,小白也能轻松使用🎯

08. GitHub收集盒

8.1 人工智能

国内外大模型综合性多维度中文能力评测榜单:CLiBSuperCLUE

开源大模型食用指南:围绕开源大模型、针对国内初学者、基于 Linux 平台的中国宝宝专属大模型教程

8.2 应用软件

  • TVapk:收集各大 AndroidTV 的 apk 应用,可免费看 VIP 和国外电影电视
  • 绝版游戏保护工程:收录 DOS 游戏,红白机,SFC/MD 等主机游戏机
  • Awesome Mac:收集各种好用的 Mac 软件,包括但不限于开源、免费软件
  • Awesome macOS OS Apps:适用于 macOS 的出色开源应用程序列表
  • Best App:免费及付费的 iOS/macOS App 作品推荐列表
  • Awesome Bilibili Extra:收集一些让我们在使用 B 站时更加方便的浏览器扩展/脚本/程序
  • Awesome Privacy:专注于隐私和安全的软件和服务商的精选列表
  • Awesome Free Apps:免费的 PC 和 移动端应用收集

8.3 其他收集

项目还涵盖各类 shell

09. 技术极客论坛

获取更新


科技最前沿
https://dmucd.github.io/posts/773cbcea
作者
阿岩
发布于
2022年7月2日
许可协议