PCDVD數位科技討論區

PCDVD數位科技討論區 (https://www.pcdvd.com.tw/index.php)
-   七嘴八舌異言堂 (https://www.pcdvd.com.tw/forumdisplay.php?f=12)
-   -   關於UNICODE14.0的一些觀察雜記 (https://www.pcdvd.com.tw/showthread.php?t=1189228)

FLYFLY4 2021-09-28 12:35 AM

我覺得有些在雞同鴨講,但我覺得我前面累積的論述應該已經很清楚白話了。
再強調一次,這真的不是「編碼」的問題,這是 "unicode block" 萬國碼「區段」「順位」的問題。
而「區段『內』」「字元和符號」的「編碼排序」,「基本上」都沒有問題(雖然我還是可以挑出細骨頭,但或許會扯太遠了)。

引用:
作者substar999
因為這編碼本來就不適合用來作為排序的索引,您硬用EXCEL排序自然會遇到問題,
而且EXCEL非常不適合處理大量的資料。
若是有程式背景的人,遇到這類情況就會規劃資料格式或用資料庫軟體處理,
自然不會遇到您的問題。


---

我的認知是,理論上應該要可以使用試算表這種前端「視覺直觀」軟體就能解決的問題,就不需要去搞資料庫這麼複雜。
試算表相對前端,也相對「視覺直觀」,我編輯的資料表格,理論上就是期望能讓終端使用者「一目了然」,
幾乎所有內容都擺在眼前給你看,而不像資料庫很多東西可能都藏在後面看不到。
(至少我開始分享文件幾年來,實際收到的問題討論電子郵件目前只有一封信)
一目了然的意思是,每個格子、欄位、列、格子的「內容字串」,為了要「視覺直觀」,
格子和字都會設定「不同的」字級、字體粗細、顏色、字型。
但至少我曾經摸索過的MsAccess做不到試算表這樣的視覺直觀設定。

引用:
作者silent
幾年下來也看到樓主花了很多時間想為正體中文和數位編碼做點事,
若能分出點時間把程式和資料庫存取搞懂,寫些簡單的小程式相信能大幅增進效率,
也能對這些編碼更了解,相對也能做更多事。

Excel或其他試算表,甚至csv檔案其實也都能當作資料庫使用,當然效率和功能不強,
但看樓主目前在做的事應該也夠用了,至少不用另外去搞資料庫設定啥的。

alpha 2021-09-28 09:03 AM

沒事,大家八卦討論分享,切勿介意 :-)

引用:
作者substar999
各人看法不同而已,小弟這邊是就起源來看,
您的想法是現在的Linux已經是匯集全球智慧結晶的產物,
無法被輕易劃分是哪國的產物,這想法也沒錯。
假如我的說法讓您感到不舒服,小弟在此向您說聲抱歉。

florance 2021-09-28 10:41 AM

把努力與偷渡的想法切開, 可以認同努力的部分...

然後回頭去看偷渡的部分... 或許他該努力的方向是從頭開發完整的系統... :rolleyes:

FLYFLY4 2021-09-28 02:01 PM

因為發現自己漏掉了「子群組區段名稱 - Subgroup Block Name - 依碼位排序」這個工作表的流水號欄位,更新了檔案。

substar999 2021-09-30 08:31 AM

其實還是很感謝您的整理,不過前面網友的意見也不是隨便提的,

首先您在前面有提到這編碼是給人讀的依據如下,

個人認為以常用->罕用順序作為這編碼是給人讀的證據似乎有點薄弱?

還是您手頭上有UNICODE組織對此作法的說明?

引用:
作者FLYFLY4
然而我發現,拉丁字母系列的 "block" 的排序,就完全是常用字母或連結字在前,
相對罕用的拉丁字母連結字等等在後。
所以不只是給機器讀,也是給人讀的。文書軟體排序的判讀方便性是有差別的。


使用UNICODE編碼的意義在於文字儲存到檔案中時,每個文字都有獨一無二的編碼,

由於文字間編碼無任何衝突,使得您可以在一個純文字檔案中塞入各國語言而且還可以正常顯示(在系統與字型皆支援的情況下),

事實上若您本身有點計算機的基礎,直接看檔案的RAW DATA,

就可以看到這些文字所對應的UNICODE編碼是實際被儲存到檔案裡面,

電腦則透過讀取檔案中的RAW DATA與UNICODE表比對後,

配合字型將文字顯示在畫面上,使用者才能看到顯示在螢幕上的文字,

而非一堆亂碼,這代表這編碼真的是給電腦讀的,一般人幾乎不會有讀它的機會。

您所強調的「順位」問題自然也不那麼重要(我自己是認為根本沒差)

但話說回來,雖然一般情況下,人不會去讀這個編碼,但有時還是會有反查編碼的需要,

我自己的作法很簡單,直接在純文字編輯器輸入那個字,再去看它的RAW DATA找到編碼即可。

以上,若有說錯,歡迎諸位PCDVD的高手隨便鞭。

引用:
作者FLYFLY4
我覺得有些在雞同鴨講,但我覺得我前面累積的論述應該已經很清楚白話了。
再強調一次,這真的不是「編碼」的問題,這是 "unicode block" 萬國碼「區段」「順位」的問題。
而「區段『內』」「字元和符號」的「編碼排序」,「基本上」都沒有問題(雖然我還是可以挑出細骨頭,但或許會扯太遠了)。

FLYFLY4 2021-09-30 11:13 PM

unicode pdf 之中,一些 我google不出所以然的/我看不懂的 英文單字,這裡有問有機會。
這些單字我真的看不懂到底是什麼意思,使用什麼樣的符合臺灣社會傳統國語習慣思路的正體中文短詞,
最能精準的表達出這些英文單字在這些"unicode pdf"之中所要表達的意思?
(方便附上參考資料源網址的話會更好)

"Tashkil"
http://www.unicode.org/charts/PDF/U0600.pdf

Dot "reph"
http://www.unicode.org/charts/PDF/U0D00.pdf

"Crops"
"APL"
http://www.unicode.org/charts/PDF/U2300.pdf

Chess "equihoppers"
http://www.unicode.org/charts/PDF/U1FA00.pdf

unicode pdf 之中,還有很多英文字串,乍看之下很像是其他語言的英文近似音直譯,
這些英文字串我暫時選擇放棄不理它們。

substar999 2021-10-01 01:02 AM

Chess equihoppers
國際象棋等距躍子
https://chukaml.tripod.com/linguist...rt/U01FA00.html

Tashkil
阿拉伯文字標示母音和其他音的符號(叫做 tashkil)
http://www.ysljdj.com/topic19/tc-19-841.html

Malayalam/Dot-Reph
指馬拉雅拉姆文舊式拼寫方法
https://unicode.fandom.com/wiki/Malayalam/Dot-Reph

CROP
當"裁切符號"來看吧,跟繪圖或列印範圍有關的

APL
APL (A Programming language)
https://everything2.com/title/Miscellaneous+Technical
https://zh.wikipedia.org/wiki/APL%E8%AA%9E%E8%A8%80

個人感覺,有些專有名詞不翻譯比翻譯來得更好,翻得好自然沒話說,
翻得不好那還真是有看=沒有懂

引用:
作者FLYFLY4
unicode pdf 之中,一些 我google不出所以然的/我看不懂的 英文單字,這裡有問有機會。
這些單字我真的看不懂到底是什麼意思,使用什麼樣的符合臺灣社會傳統國語習慣思路的正體中文短詞,
最能精準的表達出這些英文單字在這些"unicode pdf"之中所要表達的意思?
(方便附上參考資料源網址的話會更好)

"Tashkil"
http://www.unicode.org/charts/PDF/U0600.pdf

Dot "reph"
http://www.unicode.org/charts/PDF/U0D00.pdf

"Crops"
"APL"
http://www.unicode.org/charts/PDF/U2300.pdf

Chess "equihoppers"
http://www.unicode.org/charts/PDF/U1FA00.pdf

unicode pdf 之中,還有很多英文字串,乍看之下很像是其他語言的英文近似音直譯,
這些英文字串我暫時選擇放棄不理它們。

FLYFLY4 2021-10-01 01:06 AM

引用:
作者substar999
Chess equihoppers
國際象棋等距躍子
https://chukaml.tripod.com/linguist...rt/U01FA00.html

Tashkil
阿拉伯文字標示母音和其他音的符號(叫做 tashkil)
http://www.ysljdj.com/topic19/tc-19-841.html

Malayalam/Dot-Reph
指馬拉雅拉姆文舊式拼寫方法
https://unicode.fandom.com/wiki/Malayalam/Dot-Reph

CROP
當"裁切符號"來看吧,跟繪圖或列印範圍有關的

APL
APL (A Programming language)
https://everything2.com/title/Miscellaneous+Technical
https://zh.wikipedia.org/wiki/APL%E8%AA%9E%E8%A8%80


乍看之下就像是港式中文和中國大陸的中文思維。

substar999 2021-10-01 01:08 AM

要是這樣還能挑我也沒辦法了,不然自創翻譯也是個辦法。
反正語言就是這樣,先翻的不一定贏,常用的才是王道。

譬如"幀率"、"高清",個人看到也是很頭痛,但已經不少人在用了。

另外,對於有些不翻還好,翻譯後等於看不懂的詞語,個人覺得還是別翻譯得好!
除非您願意花更多時間解釋這個詞語的來源。

引用:
作者FLYFLY4
乍看之下就像是港式中文和中國大陸的中文思維。

FLYFLY4 2021-10-01 01:22 AM

我會嘗試把我認為合理的翻譯詞彙挑選整理進單一文件檔案內。
當然別人要不要認同我我整理的版本,又是另一回事了,不強求。

引用:
作者substar999
要是這樣還能挑我也沒辦法了,不然自創翻譯也是個辦法。
反正語言就是這樣,先翻的不一定贏,常用的才是王道。

譬如"幀率"、"高清",個人看到也是很頭痛,但已經不少人在用了。

另外,對於有些不翻還好,翻譯後等於看不懂的詞語,個人覺得還是別翻譯得好!
除非您願意花更多時間解釋這個詞語的來源。


所有的時間均為GMT +8。 現在的時間是02:26 AM.

vBulletin Version 3.0.1
powered_by_vbulletin 2025。