- UID
- 58
- 阅读权限
- 100
- 精华
- 魅力
-
- 信用
-
- 注册时间
- 2007-6-23
- 在线时间
- 小时
- 最后登录
- 1970-1-1
|
楼主 |
发表于 2025-1-15 23:59
|
显示全部楼层
本帖最后由 blindholmes 于 2025-1-16 00:00 编辑
放弃了
我对着那个 python2 的项目看了半天,我把 reatroArch 的源码拉下来也看了半天
完全给我干迷惑了
就纯看 reatroArch 里的定义,也是一个 wav 音频的 base64
看着挺简单,但是我转出来了,却不播放音频
去那个 python2 的项目看了看实现逻辑:
- if USE_ESPEAK:
- text_to_say = "".join(texts).replace('"', " [] ")
- cmd = "espeak "+'"'+text_to_say+'"'+" --stdout > tts_out.wav"
- os.system(cmd)#, shell=True)
- wav_data = open("tts_out.wav").read()
- else:
- text_to_say = " ".join(texts2).replace("...", " [] ").replace(" ' s ", "'s ").replace(" ' t ", "'t ").replace(" ' re ", "'re ").replace(" ' m ", "'m ").replace("' ", "").replace(" !", "!").replace('"', " [] ")
- print [text_to_say]
- wav_data = TextToSpeech.text_to_speech_api(text_to_say, source_lang=target_lang)
- wav_data = self.fix_wav_size(wav_data)
- wav_data = base64.b64encode(wav_data)
复制代码
看起来没什么问题吧?无非就是读一个音频数据流,然后修整一下数据转成 base64 呗
但是,往 TextToSpeech.text_to_speech_api 这里看,发现返回的就是一个 base64
于是,这种情况就是修整了一下base64以后又base64了一下……您搁这加密呢?
其实我也照葫芦画瓢,把修整的函数用 nodejs 又实现了一遍,也尝试了 base64 两遍,结果……还是不行,我放弃了 |
|