請推薦幾本有關抽樣技術的權威著作
用。
從總費用函數(shù)的公式01LThhhCccn????中可以看出,只有1Lhhhcn??是與各層樣本量hn有關的費用。
最優(yōu)分配的目標是同時權衡費用和方差兩個指標,在方差給定時使費用盡可能的小,或在費用給定時使方差盡可能的小。
因此利用Cauchy-Schwarz不等式,可以得出(1)在給定方差??stVy的情況下,使得總費用最小的層樣本量的個數(shù)的確定公式為:1121()(\\\/)\\\/LLhhhhhhhhLhhhWScWScnVWSN?????????(2)在給定總費用TC的情況下,使得方差??stVy最小的層樣本量的個數(shù)的確定公式為;011()(\\\/)LThhhhLhhhhCcWScnWSc???????最優(yōu)分配的結(jié)果表明:hn與hN,hS成正比,而與hc成反比。
從而得出下面的行動準則:倘若(1)第h層所含有的單元數(shù)較多;(2)第h層內(nèi)部單元的差異程度較大;(3)第h層每個樣本所需的費用較低,則對第h層需要抽取一個含量較多的樣本。
2、特殊情形—內(nèi)曼最優(yōu)分配上面所討論的最優(yōu)分配是一般情況下的最優(yōu)分配,如果假定各層的單位抽樣費用相等,即hcc?,那么費用函數(shù)就變?yōu)?TCccn??。
此時分配hnn的表達式將大大的簡化:11hhhhhLLhhhhhhnWSNSnWSNS??????這種形式的分配就被稱為內(nèi)曼最優(yōu)分配,簡稱為內(nèi)曼分配。
又稱適度法,該種方法是最優(yōu)分配的一個特例。
事實上,這一結(jié)論早在1923年就由俄國學者楚波羅給出了證明,但一直沒有引起注意,直到1934年內(nèi)曼重新給出它的證明,它才逐漸引起人們的重視,因此這種形式的最優(yōu)分配常被稱為內(nèi)曼最優(yōu)分配。
內(nèi)曼最優(yōu)分配法在考慮各層合理權重的情況下,又使抽樣方差減小到可能范圍,這種分配方法在使用時比比例分配法又前進了一步。
(三)最優(yōu)分配與比例分配的精度比較分層隨機抽樣中,依照定義,最優(yōu)分配時估計量的精度比比例分配時估計量的精度高,但比例分配是自加權的,計算比較方便。
而內(nèi)曼分配考慮到層權和各層變異程度的因素,會使抽樣精度大大提高,兩者各有優(yōu)點。
但是在實際工作中具體選擇哪種分配方法,則此時要對兩種方法的估計量的精度進行一下比較。
我們知道比例分配時估計量的方差為:222111()propstfVySSSnnN??????而內(nèi)曼分配時估計量的最小方差為:2211()()LoptsthhhVyWSSnN????因此:22211()()()()0LLpropstoptsthhhhhhVyVySWSWSSnn??????????????若諸hS很接近,則比例分配與內(nèi)曼最優(yōu)分配的精度相差無幾。
只有當各層的hS相差較大時,最優(yōu)分配比比例分配在精度上才有較大的得益。
因此,在設計抽樣方案時,可依已有的信息對各層的hS的離散程度加以分析,以決定是采用比例分配還是最優(yōu)分配。
特別地,如果各層的容量、層內(nèi)差異大小及層內(nèi)平均每單元的抽樣費用十分接近時,也可直接按等額方法分配總樣本量。
此時hnnL?。
(四)實際抽樣中分配方法的選取原則內(nèi)曼分配是一般最優(yōu)分配的特例,按比例分配又是內(nèi)曼分配的特例,所以,一般最優(yōu)分配是樣本容量分配的通用規(guī)則。
由于不同的分配規(guī)則引起的層樣本容量不同,產(chǎn)生的抽樣效果也會有差別,所以如果分配方式不當,就會引起抽樣效果的損失。
選取分配方法,應該考慮具體的調(diào)查目的,調(diào)查目的的不同,樣本容量的選取規(guī)則也有差別。
1、調(diào)查目的是取得總體特定值的情況在這種情況下,分層實際上是為了改進這些特定值估計量的效率。
現(xiàn)實中采用分層抽樣大多數(shù)是為了達到這一目的。
在實際工作中,比例分配法最常用。
由于它所抽取的樣本容量考慮了各層的合理權重,使得綜合計算的樣本指標能切合實際情況,并且操作實施方便,在不要求費用等因素時很實用。
若在給定的費用下,使估計量的方差??stVy達到最小,或者在給定的估計量方差V下,使得總費用達到最小,則使用一般最優(yōu)分配。
內(nèi)曼最優(yōu)分配法在考慮各層合理權重的情況下,又使抽樣方差減小到可能范圍,這種分配方法在使用時比比例分配法又前進了一步,而且它是一般最優(yōu)分配法的特殊情況,即對于每個抽樣單元來說抽樣時所花費用都相等。
2、調(diào)查目的是進行各層之間的比較一般來說,這種比較最好是在有相同相對標準誤的層樣本估計量之間進行,應該用相同的樣本容量,除非總體方差或單位調(diào)查費用在層間變化很大。
在后一種情況下,應使分配的各層樣本容量與層總體標準差成正比,與層平均費用的平方根成反比,這樣會使總體層與層之間差的平均方差達到最小。
3、調(diào)查目的是既要估計整個總體也要估計層特定值的情況在這種調(diào)查結(jié)果對總體和各層(即子總體)都需要的情況下,樣本容量的分配應視主次而定。
如果調(diào)查的主要目的是估計整個總體,那最優(yōu)分配是適當?shù)模绻蟮玫母鲗拥慕y(tǒng)計量更重要,那么,不論從提高層估計精度還是從使層與層更容易比較來講,就必須做一些特定的樣本容量分配,以便在這兩個目的之間做一些妥協(xié)。
四、多變量情況下樣本量在各層的分配一次抽樣調(diào)查中調(diào)查項目或指標可能不止一個。
因此,往往總樣本量對某個指標的最優(yōu)分配不一定也是對其它指標的最優(yōu)分配,有時會出現(xiàn)相互矛盾的情況。
因此對于一個含有多變量的調(diào)查來說,需要找到一種折中的分配方案。
(一)比例分配在分層隨機抽樣中,當一項調(diào)查含有多個指標時,最簡單的一種樣本量的分配方式就是比例分配。
由于比例分配并不涉及具體的指標,并且此時總體總量和總體均值的估計都是自加權的,不但形式簡單,而且數(shù)據(jù)處理也相對容易,并且在多數(shù)情況下都能得到比較令人滿意的結(jié)果,所以此時這種分配方式是可取的。
(二)各指標最優(yōu)分配平均法該方法的基本思想是先在眾多的指標中,選擇最重要的K個,分別按最優(yōu)分配原則計算出各層應分配的樣本量jhn,然后求其平均值:11KhjhjnnK???由于各指標之間一般具有較高的相關性,因此,各指標的最優(yōu)分配結(jié)果懸殊不會太大。
考慮到在計算最優(yōu)分配時還受到hS估計誤差的影響,因此,在實際中這樣處理就可以了。
(三)查特吉(Chatterjee)折中方法(1967年)假定經(jīng)過挑選后,有K個主要指標,jhn為第j個指標在第h層按最優(yōu)分配的樣本量,n為第h層應分配的樣本量,查特吉提出折中的辦法是:21211KjhjhLKjhhjnnnn???????查特吉法與平均法的結(jié)果很接近,它們都是在諸jhn中進行折中。
若jhn間相差很大,不能明顯的折中,此時,需建立一些準則來確定各層樣本量的分配。
(四)耶茨(Yates)方法這種方法應用于有一個特定目的的調(diào)查,這種調(diào)查中由于估計量給定的誤差所引起的損失是可以用錢或效用來衡量的。
把總的預期損失L看作估計量的方差的線性函數(shù):,1()KjjstjLaVy???則可進一步經(jīng)過變換,推導出結(jié)論為:1\\\/(\\\/)hhhhLhhhhWACnnWAC???,111()(\\\/)LLhhhhhhhhWAnWACLC?????,21KhjjhjAaS???其中:2jhS是第j個指標在第h層的方差;ja為系數(shù);,jsty是第j個指標的總體均值估計量。
由于比例分配的樣本是自加權的,因此,其估計量及其方差的確定形式都較最優(yōu)分配時更為簡便。
但如果各層的因子\\\/hhSC之間差異很大時,最優(yōu)分配將會比比例分配更為有效。
然而,由于方差對于分配中發(fā)生的小的甚至是中等的變動并不敏感,因此,基什(LKish?)認為在實際中(1)除非各層的因子\\\/hhSC之間有實質(zhì)性的差異,一般不要采用最優(yōu)分配。
否則最優(yōu)分配多出的效益可能會被加權和特別細致工作的額外花費所抵消。
一般來說,要好幾倍的差異才值得做最優(yōu)分配。
若\\\/hhSC的幾個值大致相等,就要用比例分配。
(2)最優(yōu)分配往往不是估計比例值的經(jīng)濟方法,因為比例的標準差等于(1)hhPP?,它們對于0.1到0.9之間變動的hP值是不敏感的。
(3)應用最優(yōu)分配時,在實踐上要避免使抽樣比成為復雜的分數(shù)。
(4)很多潛在的效益常常只需使用一些不同的抽樣比就可以得到。
有時只用兩個抽樣比就可以取得大部分的效益,對絕大多數(shù)元素采用一個低抽樣比,而對一個只包含大元素的特殊層則采用一個高抽樣比。
有時,甚至可使這些特殊層能被當然的選入樣本(即使其抽樣比為1),以完全排除它對抽樣誤差的影響。
【參考文獻】??1金勇進,杜子芳,蔣研.抽樣技術??M.北京:中國人民大學出版社,2008. ??2馮士雍,倪加勛,鄒國華.抽樣調(diào)查理論與方法??M.北京:中國統(tǒng)計出版社,1998. ??3倪加勛.抽樣調(diào)查??M.大連:東北財經(jīng)大學出版社,1994. ??4????美W.G.科克倫.抽樣技術??M.張堯庭譯.北京:中國統(tǒng)計出版社,1985. ??5謝邦昌.抽樣調(diào)查的理論及其應用方法??M.北京:中國統(tǒng)計出版社,1998. 用手機掃此二維碼繼續(xù)閱讀:分享到:使用一鍵分享,輕松賺取財富值,了解詳情嵌入播放器:普通尺寸(450*500pix)較大尺寸(630*500pix)預覽復制本課圖譜數(shù)學高三下滬教版第18章 基本統(tǒng)計方法期中考試
如何挑選time series analysis的入門書籍
一、統(tǒng)計學基礎部分1、《統(tǒng)計學》 David Freedman等著,魏宗舒,施錫銓等譯 中國統(tǒng)計據(jù)說是統(tǒng)計思想講得最好的一本書,讀了部分章節(jié),受益很多。
整本書幾乎沒有公式,但是講到了統(tǒng)計思想的精髓。
2、《Mind on statistics(英文版)》 機械工業(yè)只需要高中的數(shù)學水平,統(tǒng)計的掃盲書。
有一句話影響很深: Mathematics as to statistics is somethinglike hammer, nails, wood as to a house, it's just thematerial andtools but not the house itself。
3、《Mathematical Statistics and Data Analysis(英文版.第二版)》 機械工業(yè)看了就發(fā)現(xiàn)和國內(nèi)的數(shù)理統(tǒng)計樹有明顯的不同。
這本書理念很好,講了很多新的東西,把很熱門的Bootstrap方法和傳統(tǒng)統(tǒng)計在一起講了。
Amazon上有書評。
4、《Business Statistics a decision making approach(影印版)》 中國統(tǒng)計在實務中很實用的東西,雖然往往為數(shù)理統(tǒng)計的老師所不屑5、《Understanding Statistics in the behavioral science(影印版)》 中國統(tǒng)計和上面那本是一個系列的。
老外的書都挺有意思的6、《探索性數(shù)據(jù)分析》中國統(tǒng)計 和第一本是一個系列的。
大家好好看看陳希儒老先生做的序,可以說是對中國數(shù)理統(tǒng)計的一種反思。
二、回歸部分1、《應用線性回歸》 中國統(tǒng)計還是著名的藍皮書系列,有一定的深度,道理講得挺透的。
看看里面對于偏回歸系數(shù)的說明,絕對是大開眼界啊
非常精彩的書2、《Regression Analysis by example (3rd Ed影印版)》這是偶第一本從頭到底讀完的原版統(tǒng)計書,太好看了。
那張?zhí)摂M變量寫得比小說都吸引人。
沒什么推導,甚至說“假定你有統(tǒng)計可以算出結(jié)果”,主要就是將分析,怎么看圖,怎么看結(jié)果。
看完才覺得回歸真得很好玩3、《Logistics回歸模型——方法與應用》 王濟川 郭志剛高等教育 不多的國內(nèi)的經(jīng)典統(tǒng)計教材。
兩位都是社會學出身,不重推導重應用。
每章都有詳細的SAS和SPSS程序和輸出的分析。
兩位估計洋墨水喝得比較多,中文寫的書,但是明顯老外寫書的風格三、多元1、《應用多元分析(第二版)》 王學民 上海財經(jīng)大學現(xiàn)在好像就是用的這本書,但是請注意,這本書的亮點不是推導,而是后面和SAS結(jié)合的部分,以及其中的一些想法(比如P99 n對假設檢驗的影響,絕對是統(tǒng)計的感覺,不是推推公式就能感覺到的)。
這是一本國內(nèi)很好的多元統(tǒng)計教材。
2、《Analyzing Multivariate Data(英文版)》 Lattin等著 機械工業(yè) 這本書有很多直觀的感覺和解釋,非常有意思。
對數(shù)學要求不高,證明也不夠好,但的確是“統(tǒng)計書”,不是數(shù)學書。
3、《Applied Multivariate Statistical Analysis (5th Ed影印版)》 Johnson Wichem 著中國統(tǒng)計個人認為是國內(nèi)能買到的最好的多元統(tǒng)計書了。
Amazon 上有人評論,評價很高的。
不過據(jù)王學民老師說,這本書的證明還是有不太清楚,老外實務可以,證明實在不咋的,呵呵四、時間序列1、《商務和經(jīng)濟預測中的時間序列模型》 弗朗西斯著Amazon 上五星的書,講了很多很新的東西也非常實用。
我看完才知道,原來時間序列不知有AR(1) MA(1)啊,哈2、《Forecasting and Time Series an applied approach(thirdedition)》 Bowerman Connell 著本書的主講Box-Jenkins(ARIMA)方法,附上了SAS和Minitab程序五、抽樣1、《抽樣技術》 科克倫著 張堯庭譯絕對是該領域最權威,最經(jīng)典的書了。
王學民老師說:這本書不是那么好懂的,數(shù)學系的人,就算看得懂每個公式,未必能懂它的意思(不是數(shù)學系的人,還是別看了吧)。
2、《Sampling: Design and Analysis(影印版)》 Lohr著 中國統(tǒng)計講了很多很新的方法,無應答,非抽樣誤差,再抽樣,都有討論。
也很不好懂,當時偶是和《Advance MicroeconomicTheory》一起看的,后者被許多人認為是夢魘,但是和前者一比,好懂多了。
主要還是理念上的差距。
我們的統(tǒng)計思想和數(shù)據(jù)感覺有待加強啊六、及其他1、《SAS與應用統(tǒng)計分析》 王吉利 張堯庭 主編好書啊2、《SAS V8基礎教程》 汪嘉岡編 中國統(tǒng)計主要講編程,沒怎么講統(tǒng)計。
如果想加強SAS編程可以考慮。
3、《SPSS11統(tǒng)計分析教程(基礎篇)(高級篇)》 張文彤北京希望當初第一次看這本書,發(fā)現(xiàn)怎么幾乎都看不懂,尤其是高級篇,現(xiàn)在終于搞清楚了:)4、《金融市場的統(tǒng)計分析》 張堯庭著 廣西師范大學張老師到底是大家,薄薄的一本書,言簡意賅,把主要的金融模型都講清楚了。
看完會發(fā)現(xiàn),分析金融單單數(shù)學模型還是紙上談兵,必須加上統(tǒng)計模型和統(tǒng)計方法才能真正應用。
本書用的多元統(tǒng)計(代數(shù)知識)比較深。
分層抽樣是什么
一、統(tǒng)計學基礎部分1、《統(tǒng)計學》 David Freedman等著,魏宗舒,施錫銓等譯 中國統(tǒng)計出版社據(jù)說是統(tǒng)計思想講得最好的一本書,讀了部分章節(jié),受益很多。
整本書幾乎沒有公式,但是講到了統(tǒng)計思想的精髓。
2、《Mind on statistics(英文版)》 機械工業(yè)出版社只需要高中的數(shù)學水平,統(tǒng)計的掃盲書。
有一句話影響很深: Mathematics as to statistics is somethinglike hammer, nails, wood as to a house, it's just thematerial andtools but not the house itself。
3、《Mathematical Statistics and Data Analysis(英文版.第二版)》 機械工業(yè)出版社看了就發(fā)現(xiàn)和國內(nèi)的數(shù)理統(tǒng)計樹有明顯的不同。
這本書理念很好,講了很多新的東西,把很熱門的Bootstrap方法和傳統(tǒng)統(tǒng)計在一起講了。
Amazon上有書評。
4、《Business Statistics a decision making approach(影印版)》 中國統(tǒng)計出版社在實務中很實用的東西,雖然往往為數(shù)理統(tǒng)計的老師所不屑5、《Understanding Statistics in the behavioral science(影印版)》 中國統(tǒng)計出版社和上面那本是一個系列的。
老外的書都挺有意思的6、《探索性數(shù)據(jù)分析》中國統(tǒng)計出版社 和第一本是一個系列的。
大家好好看看陳希儒老先生做的序,可以說是對中國數(shù)理統(tǒng)計的一種反思。
二、回歸部分1、《應用線性回歸》 中國統(tǒng)計出版社還是著名的藍皮書系列,有一定的深度,道理講得挺透的。
看看里面對于偏回歸系數(shù)的說明,絕對是大開眼界啊
非常精彩的書2、《Regression Analysis by example (3rd Ed影印版)》這是偶第一本從頭到底讀完的原版統(tǒng)計書,太好看了。
那張?zhí)摂M變量寫得比小說都吸引人。
沒什么推導,甚至說“假定你有統(tǒng)計軟件可以算出結(jié)果”,主要就是將分析,怎么看圖,怎么看結(jié)果。
看完才覺得回歸真得很好玩3、《Logistics回歸模型——方法與應用》 王濟川 郭志剛高等教育出版社 不多的國內(nèi)的經(jīng)典統(tǒng)計教材。
兩位都是社會學出身,不重推導重應用。
每章都有詳細的SAS和SPSS程序和輸出的分析。
兩位估計洋墨水喝得比較多,中文寫的書,但是明顯老外寫書的風格三、多元1、《應用多元分析(第二版)》 王學民 上海財經(jīng)大學出版社現(xiàn)在好像就是用的這本書,但是請注意,這本書的亮點不是推導,而是后面和SAS結(jié)合的部分,以及其中的一些想法(比如P99 n對假設檢驗的影響,絕對是統(tǒng)計的感覺,不是推推公式就能感覺到的)。
這是一本國內(nèi)很好的多元統(tǒng)計教材。
2、《Analyzing Multivariate Data(英文版)》 Lattin等著 機械工業(yè)出版社 這本書有很多直觀的感覺和解釋,非常有意思。
對數(shù)學要求不高,證明也不夠好,但的確是“統(tǒng)計書”,不是數(shù)學書。
3、《Applied Multivariate Statistical Analysis (5th Ed影印版)》 Johnson & Wichem 著中國統(tǒng)計出版社個人認為是國內(nèi)能買到的最好的多元統(tǒng)計書了。
Amazon 上有人評論,評價很高的。
不過據(jù)王學民老師說,這本書的證明還是有不太清楚,老外實務可以,證明實在不咋的,呵呵四、時間序列1、《商務和經(jīng)濟預測中的時間序列模型》 弗朗西斯著Amazon 上五星推薦的書,講了很多很新的東西也非常實用。
我看完才知道,原來時間序列不知有AR(1) MA(1)啊,哈2、《Forecasting and Time Series an applied approach(thirdedition)》 Bowerman & Connell 著本書的主講Box-Jenkins(ARIMA)方法,附上了SAS和Minitab程序五、抽樣1、《抽樣技術》 科克倫著 張堯庭譯絕對是該領域最權威,最經(jīng)典的書了。
王學民老師說:這本書不是那么好懂的,數(shù)學系的人,就算看得懂每個公式,未必能懂它的意思(不是數(shù)學系的人,還是別看了吧)。
2、《Sampling: Design and Analysis(影印版)》 Lohr著 中國統(tǒng)計出版社講了很多很新的方法,無應答,非抽樣誤差,再抽樣,都有討論。
也很不好懂,當時偶是和《Advance MicroeconomicTheory》一起看的,后者被許多人認為是夢魘,但是和前者一比,好懂多了。
主要還是理念上的差距。
我們的統(tǒng)計思想和數(shù)據(jù)感覺有待加強啊六、軟件及其他1、《SAS軟件與應用統(tǒng)計分析》 王吉利 張堯庭 主編好書啊2、《SAS V8基礎教程》 汪嘉岡編 中國統(tǒng)計出版社主要講編程,沒怎么講統(tǒng)計。
如果想加強SAS編程可以考慮。
3、《SPSS11統(tǒng)計分析教程(基礎篇)(高級篇)》 張文彤北京希望出版社當初第一次看這本書,發(fā)現(xiàn)怎么幾乎都看不懂,尤其是高級篇,現(xiàn)在終于搞清楚了:)4、《金融市場的統(tǒng)計分析》 張堯庭著 廣西師范大學出版社張老師到底是大家,薄薄的一本書,言簡意賅,把主要的金融模型都講清楚了。
看完會發(fā)現(xiàn),分析金融單單數(shù)學模型還是紙上談兵,必須加上統(tǒng)計模型和統(tǒng)計方法才能真正應用。
本書用的多元統(tǒng)計(代數(shù)知識)比較深。