PCDVD數位科技討論區
PCDVD數位科技討論區   註冊 常見問題 標記討論區為已讀

回到   PCDVD數位科技討論區 > 其他群組 > 七嘴八舌異言堂
帳戶
密碼
 

  回應
 
主題工具
ben_chien
Elite Member
 
ben_chien的大頭照
 

加入日期: Oct 2002
您的住址: 另一個地球
文章: 4,558
整天玩數字...
難怪當初有人要郭台銘出來當總統...
     
      
__________________
大家快來加入World Community Grid(BOINC for Android)與Folding@home(Folding@Home for Android)的行列,一同找出重大疾病(愛滋、癌症、帕金森氏症...等)的解決方案
[YOUTUBE]PPc7gsZIk24[/YOUTUBE]
網路果然很危險,動不動就會被告...
發現自己越來越痴漢了...
舊 2010-01-14, 01:20 PM #41
回應時引用此文章
ben_chien離線中  
b4283
Regular Member
 
b4283的大頭照
 

加入日期: Jan 2004
文章: 83
引用:
作者李麥科
他那個是越接近0,y軸值越接近無限大

你課本裡面說的的確比較會像是真實的收入分配沒錯,但你英文寫的意思是,收入分佈的曲線偏態通常會接近右邊,不是像他那種圖

你的圖看起來似乎對,符合機率分佈的直覺,但其實並不盡然如此(它太漂亮了)
因為這類圖通常是普查資料的 normal approximation,所以,也有可能長得就像 power law 的曲線

例如,histogram 是 exponential(還蠻像的?),不過資料 density curve 是長這樣:

 
舊 2010-01-14, 10:38 PM #42
回應時引用此文章
b4283離線中  
b4283
Regular Member
 
b4283的大頭照
 

加入日期: Jan 2004
文章: 83
引用:
作者b4283
http://f.imagehost.org/0074/asdf.png (http://f.imagehost.org/view/0074/asdf)

不過在知道資料已經非 normal 的情況下
使用 normal 實在不是個好主意
舊 2010-01-15, 06:50 AM #43
回應時引用此文章
b4283離線中  
愛夢樂茶室
Amateur Member
 
愛夢樂茶室的大頭照
 

加入日期: Jul 2008
您的住址: Formosa
文章: 36
如果只是一般參考用, 通常去掉頭尾兩個極端, 這樣效率快且準確度也高.
舊 2010-01-15, 07:55 AM #44
回應時引用此文章
愛夢樂茶室離線中  
李麥科
*停權中*
 

加入日期: Jul 2008
文章: 51
引用:
作者b4283
你的圖看起來似乎對,符合機率分佈的直覺,但其實並不盡然如此(它太漂亮了)
因為這類圖通常是普查資料的 normal approximation,所以,也有可能長得就像 power law 的曲線

例如,histogram 是 exponential(還蠻像的?),不過資料 density curve 是長這樣:

http://f.imagehost.org/0074/asdf.png (http://f.imagehost.org/view/0074/asdf)

我給你的向左偏態的圖,那個本來不是normal。
我們統計講normal會是以下這種

自然界中沒有normal這種分配,只是為了方便說明與分析資料用的(其實這樣講好像有點不夠正確,但我一時也不知該怎麼說)

而且我給你圖那個本來就是太漂亮了,只是拿來比較說我覺得一般收入會是長這樣,不是說就應該是那樣啦
其實收到資料應該是離散的,認真畫就像你給的第二張圖
我們畫一條線只是稍微表示如果是實際資料的話,曲線可能是長怎麼樣子,如果我們可以收到細緻的人口統計資料,比如說,真實的每一個人的收入,是可以很逼近曲線的

你給的第一張圖,我後來查查原來是power law的一種
只是右邊沒有繼續延伸到無限大,難怪你會說那也是power law
長知識長知識
不過我是覺得國民收入分佈,峰態很少這麼極端往右推就是了
舊 2010-01-15, 09:19 AM #45
回應時引用此文章
李麥科離線中  
李麥科
*停權中*
 

加入日期: Jul 2008
文章: 51
引用:
作者愛夢樂茶室
如果只是一般參考用, 通常去掉頭尾兩個極端, 這樣效率快且準確度也高.

那也不一定

你要看是甚麼資料,還有,你到底要分析的是甚麼?
舊 2010-01-15, 09:21 AM #46
回應時引用此文章
李麥科離線中  
李麥科
*停權中*
 

加入日期: Jul 2008
文章: 51
引用:
作者b4283
不過在知道資料已經非 normal 的情況下
使用 normal 實在不是個好主意
http://i.imagehost.org/0005/adsf.png (http://i.imagehost.org/view/0005/adsf)

其實我突然想到一件事情

我本來以為以那種power law模式展示的曲線
不可能是統計分配
因為左端會跑到無限大,但是我沒想到那只是數值無限大,曲線底下的面積依舊是全部的統計資料(白話就是100%)

但我不太覺得收入會是那種極端的曲線
原因主要是因為,真正很窮很窮的人,其實很少
如果一個國家,經濟體有正常體制,按理說,不少的經濟活動需要有夠雄厚的中產階級
也就說,勞動力人口中收入穩定的人應該是占大多數

如果一個國家居然是沒有錢的人最多(也就是妳們講的那種極端狀況),我會很懷疑,那這個國家的產出是哪裡來的?
如果像是海地那種國家(抱歉了),或許妳們講的那種會是主要的狀況
中間偏左的國家,曲線長那樣,感覺就怪怪的啦

一點想法啦
舊 2010-01-15, 09:46 AM #47
回應時引用此文章
李麥科離線中  
ㄚ山
*停權中*
 

加入日期: May 2004
您的住址: 美麗阿邦
文章: 165
引用:
作者李麥科
其實我突然想到一件事情

我本來以為以那種power law模式展示的曲線
不可能是統計分配
因為左端會跑到無限大,但是我沒想到那只是數值無限大,曲線底下的面積依舊是全部的統計資料(白話就是100%)

但我不太覺得收入會是那種極端的曲線
原因主要是因為,真正很窮很窮的人,其實很少
如果一個國家,經濟體有正常體制,按理說,不少的經濟活動需要有夠雄厚的中產階級
也就說,勞動力人口中收入穩定的人應該是占大多數

如果一個國家居然是沒有錢的人最多(也就是妳們講的那種極端狀況),我會很懷疑,那這個國家的產出是哪裡來的?
如果像是海地那種國家(抱歉了),或許妳們講的那種會是主要的狀況
中間偏左的國家,曲線長那樣,感覺就怪怪的啦

一點想法啦


看到李麥克講統計真不習慣,腦袋裡一直出現「夥計」...
舊 2010-01-15, 10:07 AM #48
回應時引用此文章
ㄚ山離線中  
nomad
Junior Member
 

加入日期: Jan 2001
文章: 768
引用:
作者李麥科
但我不太覺得收入會是那種極端的曲線
原因主要是因為,真正很窮很窮的人,其實很少
如果一個國家,經濟體有正常體制,按理說,不少的經濟活動需要有夠雄厚的中產階級
也就說,勞動力人口中收入穩定的人應該是占大多數

如果一個國家居然是沒有錢的人最多(也就是妳們講的那種極端狀況),我會很懷疑,那這個國家的產出是哪裡來的?
如果像是海地那種國家(抱歉了),或許妳們講的那種會是主要的狀況
中間偏左的國家,曲線長那樣,感覺就怪怪的啦

一點想法啦

讓我亂入一下
曲線極不極端,就得看畫的人用不用心了
尤其是X軸(收入)的使用更是重點
以台灣來說
如果年所得分配表,X軸定為年收入50萬為1格,扣除在學、年紀太大的
則可以預期的,畫出來的是絕對是極端的曲線
國家絕大半數是集中在左半部,而且X軸會無限長(如果沒有故意去截斷的話)
如果X軸是使用等比級數的話
那就有趣了,大部份都會在中間

國家的產出是指GDP嗎?
這東西太好做假了,請參考文獻: 兩人吃狗屎製造到1億GDP
房地產買、賣一輪,幾天內沒有任何製造、生產,GDP就出多幾千萬了

學統計的不是都知道統計的東西有很多問題嗎?

此文章於 2010-01-15 11:07 AM 被 nomad 編輯.
舊 2010-01-15, 11:04 AM #49
回應時引用此文章
nomad離線中  
李麥科
*停權中*
 

加入日期: Jul 2008
文章: 51
引用:
作者nomad
讓我亂入一下
曲線極不極端,就得看畫的人用不用心了
尤其是X軸(收入)的使用更是重點
以台灣來說
如果年所得分配表,X軸定為年收入50萬為1格,扣除在學、年紀太大的
則可以預期的,畫出來的是絕對是極端的曲線
國家絕大半數是集中在左半部,而且X軸會無限長(如果沒有故意去截斷的話)
如果X軸是使用等比級數的話
那就有趣了,大部份都會在中間

國家的產出是指GDP嗎?
這東西太好做假了,請參考文獻: 兩人吃狗屎製造到1億GDP
房地產買、賣一輪,幾天內沒有任何製造、生產,GDP就出多幾千萬了

學統計的不是都知道統計的東西有很多問題嗎?

沒錯,其實那個圖,如果像你這樣操作X軸

我們可以畫出你要的樣子

所以統計的東西歸統計....真實的情況你不能光看個數字和幾個漂亮的統計結果就當成圭臬的
舊 2010-01-15, 11:19 AM #50
回應時引用此文章
李麥科離線中  


    回應


POPIN
主題工具

發表文章規則
不可以發起新主題
不可以回應主題
不可以上傳附加檔案
不可以編輯您的文章

vB 代碼打開
[IMG]代碼打開
HTML代碼關閉



所有的時間均為GMT +8。 現在的時間是12:27 AM.


vBulletin Version 3.0.1
powered_by_vbulletin 2025。