PCDVD數位科技討論區

PCDVD數位科技討論區 (https://www.pcdvd.com.tw/index.php)
-   七嘴八舌異言堂 (https://www.pcdvd.com.tw/forumdisplay.php?f=12)
-   -   現在還有純的文字處理機嗎? (https://www.pcdvd.com.tw/showthread.php?t=1144788)

droganfly 2018-04-09 03:50 PM

引用:
作者a843433
科大訊飛(大陸) 是用 機器學習的方式,蒐集快18TTB (對,你沒看錯,18T 個 TB 等級資料),利用海量機器學習來完成這樣的行為。



這比台灣一堆人喊雲端、喊大數據、喊機器學習,來的更實際;且,人家已經拿到很多語言分析上的專利,包含你在電話跟另外一端講任何的「中文語言」,他都有辦法即時變成文字文稿.........


e04...我現在的工作完全是靠會英文拿到的

看來我是要失業了:jolin:

海豹 2018-04-09 10:55 PM

上次看到大陸的速錄師
感覺比台灣辛苦
因為大陸的口音更多更難懂啊~~ :laugh:

[YOUTUBE]qD13eE6ZABo[/YOUTUBE]

gdrgdr 2018-04-11 01:04 AM

引用:
作者borjang'
上面這段話不太同意,手機上的中文語音辯識,個人認為已經有到實用的階段了
如果是在 google map 裡語音輸入地址,那準確率之高啊.....


限定範圍的索引當然比較容易
你在使用手機時,會用到的資訊範圍也是比一般使用小
地名路名街名排來排去就是固定那些字
但非限定範圍的資訊,真的就差很多
不信就拿一份雜誌唸一段,保證錯誤百出
更不要說專業術語,人面對面用講的都不見得聽得懂

不過上面說的科大訊飛倒是沒用過,不知道有多厲害

人生 2018-04-11 01:43 AM

最近剛好朋友介紹試接了一個聽打逐字稿的案子
因為沒有打過,朋友先丟了一個小時的學術研討會讓我試試
一個小時的逐字稿我就打了7、8個小時才痛苦的完成
朋友說熟手的速度大概是一個小時錄音檔三個小時完成
我是新手所以花了多一倍的時間
逐字稿的錄音檔品質參差不齊,有的回音雜音大,有的太小聲模糊不清
再加上國台英語三種語言夾雜的,有人英文發音超爛又死要講真的很煩
而研討會就是會有兩人以上甚至多人同時講
這個要用所謂的語音辨識軟體去跑,大概程式會先爆掉
會覺得語音辨識軟體ok,是因為你一對一又慢慢講而且錄音品質好
不信試試兩人或三人同時講不同的話,看語音辨識軟體會辨識出什麼鬼來
朋友說打逐字稿的重點不是快,基本速度有就夠了
重點在你的聽力,聽力不好或溶不進那個環境的話
就算只有十分鐘錄音檔也要搞半天才能打完
而且語音辨識軟體不會幫你加標點符號分段落
目前只試過那一小時就再也不敢看輕打逐字稿這個工作
要戴耳機重覆聽,還要隨時放大音量放小音量
前面一句不懂就要先聽後面一句或者是反過來
打完真的頭昏腦脹,不是體力累是精神累到爆
也難怪收費不便宜,但就不透露行情了

bluse 2019-05-08 08:18 PM

[YOUTUBE]msNo_wVV52w[/YOUTUBE]

泣台推薦真的好用?:jolin:

FLYFLY4 2019-05-08 08:53 PM

引用:
作者StudioA
3f4coKkg3Mc

現在還有中文文字處理機?


有閒空的話,其實可以找一台適合的現成筆電硬體,安裝客製化版本的linux,也是一個方案。
例如安裝Debian linux這款通用型的發行版,系統安裝的時候選擇陽春型的圖形桌面環境,再選擇搭配一款合適的純文字編輯器套件、以及適合的中文輸入法軟體、當然中文字形檔也要安裝足夠,拼拼湊湊,拼湊版本的中文純文字處理機就出來了。

oversky. 2019-05-08 08:56 PM

引用:
作者lifaung
目前就我所知的範圍內
最強的應該是我的客戶, 科大訊飛(大陸)

同文翻譯系統就可以上面人講, 下面語音辨識就成為文字稿紀錄
旁邊會另外配口譯同步看著文稿來翻出語音
這樣口譯人員的素質就可以不用那麼高, 也不需要額外找人提詞


這家不是去年出過新聞?

中國科技業再傳造假!科大訊飛瀉 6%,410 億人民幣蒸發
https://technews.tw/2018/09/25/iflytek-fake-ai/


引用:
科大訊飛造假起於網友 Bell Wang 在「知乎」爆料,他是世界 AI 大會的聘請的同步翻譯人員之一。科大訊飛在會場示範機器同步翻譯技術,他發現機器對英文講者的演說內容辨識錯亂,卻能譯出流暢中文,感覺不對。結果仔細一聽發現機器翻譯的中文,只是複述另一名現場人類翻譯的譯文。

科大訊飛坦承,大會上的訊飛翻譯,並非機器 AI 所譯,但是卻硬拗翻譯誤會了,科大訊飛是應主辦方要求提供語音辨識技術,把譯員的口述翻譯,轉化成文字在會場螢幕呈現。


後來有再平反?

misman+++ 2019-05-09 11:31 AM

引用:
作者oversky.
這家不是去年出過新聞?

中國科技業再傳造假!科大訊飛瀉 6%,410 億人民幣蒸發
https://technews.tw/2018/09/25/iflytek-fake-ai/




後來有再平反?


沒平反吧,就是造假....... :unbelief: :unbelief: :unbelief:

lifaung 2019-05-09 02:40 PM

引用:
作者oversky.
這家不是去年出過新聞?

中國科技業再傳造假!科大訊飛瀉 6%,410 億人民幣蒸發
https://technews.tw/2018/09/25/iflytek-fake-ai/


科大訊飛造假起於網友 Bell Wang 在「知乎」爆料,他是世界 AI 大會的聘請的同步翻譯人員之一。科大訊飛在會場示範機器同步翻譯技術,他發現機器對英文講者的演說內容辨識錯亂,卻能譯出流暢中文,感覺不對。結果仔細一聽發現機器翻譯的中文,只是複述另一名現場人類翻譯的譯文。

科大訊飛坦承,大會上的訊飛翻譯,並非機器 AI 所譯,但是卻硬拗翻譯誤會了,科大訊飛是應主辦方要求提供語音辨識技術,把譯員的口述翻譯,轉化成文字在會場螢幕呈現。

後來有再平反?


這段我一開始就說了
同文系統只能夠辨識
翻譯功能還是人工處理的

"旁邊會另外配口譯同步看著文稿來翻出語音
這樣口譯人員的素質就可以不用那麼高, 也不需要額外找人提詞"

光是要搞定一堆奇怪語言的辨識就夠困難, 還想要語言轉譯....這恐怕股溝大師都沒輒
別說東西方語系的差異
光是愛爾蘭語系要轉譯成英語你就會碰到一堆問題
--
附帶一提的是, 雖然是歪打正著, 但是發現我去年四月就講出了去年九月才有人報的新聞XD

海豹 2019-05-09 02:50 PM

最近遇到金額英文大寫的問題
發現連google翻譯都有很嚴重的錯誤
像$68689.89
翻成英文之後為

Sixty Eight Thousand Six Hundred and Eighty Nine Dollars and Eighty Nine Cents Only

貼到goolge翻回中文
竟然變成

僅有六十八萬八百九十九美元和八十九美分

68689.89變成68899.89

好奇怪啊~這種數字語法應該是很死的啊
怎麼會翻得亂七八糟的 :jolin:


所有的時間均為GMT +8。 現在的時間是12:30 PM.

vBulletin Version 3.0.1
powered_by_vbulletin 2025。