nano-pgo By AiBard123 October 8, 2024 - 2 min read nano-pgo 是一个用于教育目的的从零实现的位姿图优化工具,支持批处理优化与稀疏求解。 read more
JoyHallo By AiBard123 October 8, 2024 - 2 min read JoyHallo是一个针对普通话的数字人模型,结合音频生成视频,优化了模型推理速度。 read more
Youtube-Whisper By AiBard123 October 8, 2024 - 2 min read Youtube-Whisper是一个简单的Gradio应用,通过OpenAI的Whisper模型转录YouTube视频音频为文本。 read more
Azure OpenAI GPT-4o Audio By AiBard123 October 8, 2024 - 2 min read Azure OpenAI 的 `/realtime` API 提供低延迟的音频对话交互,适用于客服、翻译等应用。 read more
open-o1 By AiBard123 September 30, 2024 - 2 min read open-o1是一个开源实验项目,通过GPT-4o与链式推理提升逻辑问题解决能力。 read more