Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

麦克风输入功能接入和其他的一些功能修复 #47

Closed
wants to merge 87 commits into from

Conversation

Ivy233
Copy link
Contributor

@Ivy233 Ivy233 commented Jan 14, 2025

单纯的代码合并,合并范围:

  1. stream(麦克风输入)功能接入。
  2. 新增common-sdl代码相比whisper.cpp同名代码略有修改。
  3. 修复“喂喂喂”识别成“喂”,并且与“%%%”识别成一个“%”区分开。
  4. 整理输出接口,使printf从语音识别功能中分离开。
  5. 部分代码空格对齐强迫症。
    未合并功能:
  6. main.cc(文件切割)保留main分支的处理,除了输出有所修改。

lovemefan and others added 30 commits September 9, 2024 15:26
bugfix: norm operator on CUDA
2. 修复GGML更新后在decoder遇到的显存读不出来crash。
3. encoder简化。
4. 更新了一下svg文件。
目前已经跑通,时长太长的输出文本长度对不上,还是得看看。
王锦润 added 29 commits December 27, 2024 14:49
单纯的代码合并,合并范围:
1. stream(麦克风输入)功能接入。
2. 新增common-sdl代码相比whisper.cpp同名代码略有修改。
3. 修复“喂喂喂”识别成“喂”,并且与“%%%”识别成一个“%”区分开。
4. 整理输出接口,使printf从语音识别功能中分离开。
5. 部分代码空格对齐强迫症。
未合并功能:
1. main.cc(文件切割)保留main分支的处理,除了输出有所修改。
注意:当前代码有链接错误,由于修改量太大,先提交。
单纯的代码合并,合并范围:
1. stream(麦克风输入)功能接入。
2. 新增common-sdl代码相比whisper.cpp同名代码略有修改。
3. 修复“喂喂喂”识别成“喂”,并且与“%%%”识别成一个“%”区分开。
4. 整理输出接口,使printf从语音识别功能中分离开。
5. 部分代码空格对齐强迫症。
未合并功能:
1. main.cc(文件切割)保留main分支的处理,除了输出有所修改。
注意:当前代码有链接错误,由于修改量太大,先提交。
…没有问题。

不过从报错来看,是从ggml-backend-reg.cpp出来的,可能在GGML修复更好。
…没有问题。

不过从报错来看,是从ggml-backend-reg.cpp出来的,可能在GGML修复更好。
@Ivy233 Ivy233 closed this Jan 14, 2025
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

Successfully merging this pull request may close these issues.

2 participants