統計分析匯總十篇

時間：2023-06-22 09:33:05

序論：好文章的創作是一個不斷探索和完善的過程，我們為您推薦十篇統計分析范例，希望它們能助您一臂之力，提升您的閱讀品質，帶來更深刻的閱讀感受。

篇（1）

一、研究背景

股票指數的波動程度可以用來衡量金融投資的風險。金融風險是指金融資產在未來時間內預期遭到損失的可能性。隨著改革開放的深入和市場經濟的逐步建立，金融風險越來越成為人們關注的熱點之一。尤其是經濟全球化以來，我國的經濟發展更容易受到全球市場經濟變化的影響和沖擊，在此背景之下，探究金融風險已成為近期經濟運行中的一個重要話題。

非參數統計是統計學的一個重要分支。它可以只利用樣本觀察值中一些非常直觀地信息進行統計推斷，從而從數據中獲取有用信息。通過非參統計分析中的Wilcoxon秩和檢驗法和位置參數差的檢驗方法等，我們可以得到兩個時間段的股指數據的差異性和波動程度情況，從而衡量該時間段的金融投資風險。

二、數據來源

數據分別選取2016年6月和2016年5月每天的的上證指數的開盤股指數據。數據選取最近兩個月的股指數據進行分析，具有非常高的研究價值。指標選取的是5月和6月的股指數據，具有時間上的連續性，便于分析。同時數據從上到下是按時間排列的。

三、使用的統計方法

（一）描述性統計分析

描述性統計分析是在對產生的總體的分布不做任何假設的情況下，整理數據、顯示數據和分析數據，將數據中有用的信息提取出來的統計方法，常用的描述下統計方法有圖形法和數值方法。在本文中，用描述性統計分析對總體的所有變量的有關數據進行集中程度分析、離散程度分析和數據的分布等。

（二）Wilcoxon秩和檢驗法

1、基本思想

當兩組配對資料近似服從正態分布，它們差值的檢驗可以使用配對t檢驗法。如果配對資料的正態分布的假設不能成立，就可以使用Frank Wilcoxon（1945）符號秩檢驗，它是一種非參數檢驗方法。對配對資料的差值采用符號秩方法來檢驗。它的基本要求是差值數據設置為最小的序列等級和兩組配對資料是相關的（配成對）。用數據的秩代替原數據進行的假設檢驗的方法為秩和檢驗。如果相比較組之間秩次之和十分接近，則認為各組之間沒有差別；如果相比較組之間的秩和相差十分懸殊，則認為各組間存在差別。

2、Wilcoxon秩和檢驗的基本步驟

先將原始資料在不分組別的情況下從小到大排序、編秩，然后將所編秩次相加、求和、假設檢驗。

a.建立檢驗假設：兩總體分布相同；

b.兩樣本混合統一編秩次，相同觀測值（即相同秩）在不同組時取平均秩次，計算兩組秩和。

記兩個獨立的連續型隨機變量總體X和Y的樣本分別為x1，x2，…，xm和y1，y2，…，yn，不妨假設合樣本的各個之間互不相等。記合樣本容量為N=m+n。

原假設為：H0：mex=mey在理論上，假設兩個總體X和Y的分布函數具有相同的形式，但不一定Τ品植肌＜醇偕瑁

X～F（x-mex），Y～（y-mey）

從而原假設H0：mex=mey等價于H0：X和Y同分布。

將兩組樣本混合，求出每個樣本在合樣本中的秩。記樣本yj，j=1，2，…，n在合樣本中的秩為Rj，則Rj=1，2，…，N。令Wy表示總體Y的樣本y1，y2，…，yn的秩之和，即

WY=■Rj

同樣定義WX為X樣本的x1，x2，…，xm秩之和，我們稱WY或WX為Wilconxon秩和檢驗統計量。

（三）位置參數差檢驗

有位置參數的差是一個常數的檢驗問題。假設X和Y的分布函數F（x）和G（y）有這樣的關系：存在位置參數a，使得對任意的c都有F（c-a）=G（c）。正如前面所說的，由于在X的分布函數為F（x）時，X+a的分布函數為F（x-a）所以X+a和Y有相同的分布函數，a可以看成Y的位置參數與X的位置參數的差：a=Y的位置參數-X的位置參數。位置參數的差a是否是一個常數η的檢驗問題有三種情況：aη和a不等于η。所以他們的位置參數的差是否是一個常數η的檢驗問題可以等價的轉換為檢驗Z和Y的位置參數是否沒有差異的檢驗問題。

四、研究內容及分析

對5月和6月的股指數據分別做描述性統計分析和對這兩個月的的股指數據做一個綜合比較的描述性統計分析如下：

從上表可以看出五月和六月份的平均數和中位數的差異還是有的，而且與兩者共同構造的平均值和平均值都有差異性，當然這種差異性是相對較為穩定的股指數據來說的，從數值上看差異性當然不是很大。

同時從表中可以知道，五月的標準差為63.0975，六月的標準差為36.32061，說明這兩個月的股指數據的離散程度是比較大的。因為數據具有時間上的近似連續性我們還可以對數據做出如下散點圖。從圖中可以看出，5月和6月的股指波動程度不太相同。

Wilcoxon秩和檢驗法的求解過程如下：

1、將這兩個月共40天的股指合在一起，把它們的工資由小到大排列，并記下它們的秩，

2、將五月份的股指數據的秩相加，它們的和為W=299；

3、顯然，在W比較小時認為五月的股指數值比六月的小。通過查Wilcoxon秩和檢驗臨界表，在m=20，n=20時，我們有P（W

五、研究結論：

經過以上兩種方法的研究，我們可以發現，6月份的股指和5月份有明顯性差異。6月份的股指數值比5月份的高。5月份的離散程度比6月的離散程度大，即這兩個月的波動程度不一樣。經查找資料得出，兩個月波動程度不相同的原因有：（1）國際因素，尤其是5月5日時受到市場的干擾，股指大幅下降。還有美聯儲的議息也使股市不斷發生變化；（2）我國貨幣政策；（3）股票市場制度，今年春夏時我國證監會一直出臺各種完善我國金融市場的政策。

參考文獻：

篇（2）

0.引言

客觀現象之間總是存在著相互聯系和相互依存的關系，反映這些聯系的數量關系一般來說可分為兩類，一類是確定性關系，另一類是非確定性關系。確定性關系是指描述客觀現象的變量之間的關系可以用函數關系來表達的，如運動物移和時間的關系；圓的面積和半徑的關系；某種商品的銷售收入與該商品的銷售量和價格之間的關系等等，其特點是，當一個或幾個變量的取值確定時，相應的另一個變量的值就完全確定。若當一個或幾個變量的取值給定時，相應的另一個變量的值不能完全確定，而是在一定范圍內變化，則稱變量之間的這種關系為不確定性關系即所謂相關關系。一般來說，人高一些，體重會重一些，但同樣高度的人，體重往往不同；再比如空氣污染度和人口壽命之間的關系、氣象學中的溫度和濕度之間的關系等等都是這種不確定關系。回歸分析是研究相關關系的一種常用的統計方法，它是建立在對客觀事物進行大量實驗和觀測的基礎上，來尋找不確定性現象中的統計規律性的統計方法，回歸分析是通過建立統計模型研究變量間相關關系的密切程度、結構狀態、模型預測的一種有效工具。但目前已有的結果是使用一個連續向量函數來近似描述相應的不確定性相關關系，這樣就有比較大的局限性，類似于一般的函數可能有間斷點或是分段函數的問題，本文將把回歸函數的定義域作一個劃分，然后在每一個子域中用一個連續向量函數來近似描述相應的不確定性相關關系，形成逐段回歸統計分析問題。

1.回歸分析模型

為敘述方便，我們借用函數關系中關于變量的稱呼，將在不確定性關系中作為影響因素的變量X1,X2,…，Xk稱為自變量，受自變量取值影響的響應變量稱為因變量，用Y表示。假設X1,X2,…，Xk是可控變量，即它們的取值是可以預先給定的，Y是可測的隨機變量，當X1,X2,…，Xk的取值為x1,x2,…，xk時，就有一個隨機變量與之對應。令

E(Y│X1=x1,X2=x2,…Xk=xk)=f(x1,x2,…，xk)，

（1.1）

從而其它隨機因素導致的偏差就是

ε＝Y-f（x1,x2,…，xk）

（1.2）

那么X1,X2,…，Xk與Y之間的不確定性關系可表示為

Y＝E(Y│X1=x1,X2=x2,…Xk=xk)＋ε

＝f(x1,x2,…，xk)＋ε，

（1.3）

通常要求隨機誤差ε的均值為0，方差存在，即

E（ε）＝0，D（ε）＝D（Y）=σ2。

（1.4）

函數f(x1,x2,…，xk)稱為Y對X1,X2,…，Xk的回歸函數，而方程

y＝f(x1,x2,…，xk)

（1.5）

則稱為Y對X1,X2,…，Xk的回歸方程。

以上模型稱為回歸模型，其中回歸方程是一個確定性的函數關系，它也稱為理論回歸方程。

在回歸分析中，在應用上最重要并且理論上解決地最完善的是線性回歸問題，所謂線性回歸問題就是回歸函數為線性函數的回歸分析。其數學模型為：

Y＝b0＋b1x1＋…＋bkxk＋ε，

（1.6）

其中E(ε)=0，D（ε）＝D（Y）=σ2；b0,b1…，bk,σ2是未知參數。x1,x2,…，xk稱為自變量、解釋變量或預報因子，Y為因變量、應變量或預報對象。

為了確定線性回歸模型中的未知參數，必須若干次觀測，得到自變量與應變量的若干次觀測值：

y1，x11，…，x1ky2，x21，…，x2k…yn，xn1，…，xnk

在這種情況下得到下述整體回歸模型：

Y1=b0+b1x11+…+bkx1k+ε1Y2=b0+b1x21+…+bkx2k+ε2

…Yn=b0+b1xn1+…+bkxnk+εn

（1.7）

并假設

E（εi）＝0　i＝1，2，…，nDε1…εn＝σ2In（1.8）

其中In為n階單位矩陣。

為方便起見，通常引入矩陣表示上述模型，記

Y=Y1Y2…Yn，b=b1b2…bk，ε=ε1ε2…εn，y=y1y2…yn，X=1　x11　…　x1k1　x21　…　x2k…　…

…1　xn1　…　xnk。

那么整體回歸模型就可寫成

Y=Xb＋ε。

（1.9）

利用最小二乘法容易求出其回歸方程。

在一些實際問題中，變量之間的相關關系并不是線性的，而是對應某種曲線的非線性相關關系，而其中的許多可以轉化為線性回歸問題。

2.逐段統計回歸模型

許多情況下不能僅用一個向量函數近似代替一種相關關系，而作分段處理效果更好。下面介紹逐段統計回歸模型。

首先把回歸函數的定義域I劃分為互斥的子域Ii（i＝1，2，…，m），然后在每個子域上再根據觀測值的散點圖來確定適當的回歸函數，這就是逐段統計回歸模型，具體表述如下：

Y1=f1（x11，…，x■）＋ε1，（x11，…，x■）∈I1，Y2=f2（x21，…，x■）＋ε2，（x21，…，x■）∈I1，

…Ym=fm（xm1，…，x■■）＋εm，（xm1，…，x■■）∈Im，

（2.1）

并假設

E（εi）＝0　i＝1，2，…，m，Dε1…εm＝σ21…1．（2.2）其中fi（xi1，…，x■■）（i＝1，2，…，m）是逐段回歸函數，εi（i＝1，2，…，m）是滿足（2.2）的隨機誤差。

3.數值示例

例：觀測某系統得出如下數據

試求應變量Y與預報因子X的回歸方程。

解：通過作散點圖容易發現當預報因子不超過10時，其回歸方程應該是一種指數函數，設為y＝αeβt，而預報因子大于10時應該是線性回歸問題。利用最小二乘法及變量代換法不難求出其回歸方程為：

■＝2．0642＋0．2121x，1≤x≤10，109．2e－0．342x，10＜x≤40．

【參考文獻】

［1］張賀祺關于經濟回歸分析方法的使用評價，內蒙古財經學院學報，2011．（02）：15-19．

［2］李世軍,袁光才.城鎮居民人均消費支出影響因素計量分析—基于成都市的實證分析，技術經濟與管理研究，2006．（02）：53-54．

［3］馮天祥．多元線性回歸最小二乘法及其經濟分析，經濟師，2003．（11）：129．

篇（3）

根據某省電力公司的具體情況，本文所設計的電力行業統計分析系統的總體架構分為數據源、數據倉庫架構、數據訪問架構以及元數據管理等。

1.2ETL設計

用OWB（OracleWarehouseBuilder）工具對ETL進行實現，其任務為偵測ETL事件，以便啟動處理過程，同時跟蹤ETL處理日志。ETL的處理過程如下：通過Excel導入管理工具或者OWB將數據源的數據抽取、轉換、加載到ODS層的數據緩沖區的增量數據庫中；將ODS層的數據緩沖區的增量庫的數據抽取、轉換、加載到ODS層的數據緩沖區的歷史庫；將ODS層的數據緩沖區的歷史庫的數據抽取、轉換、加載到ODS層的統一視圖信息區的增量庫；將ODS層的統一視圖信息區的增量庫的數據抽取、轉換、加載到ODS層的統一視圖信息區的全量庫；將ODS層的統一視圖信息區的全量庫的數據抽取、轉換、加載到ODS層的對外數據服務接口區；將ODS層的統一視圖信息區的全量庫的數據抽取、轉換、加載到DW（數據倉庫）層。

1.3系統數據結構設計

1.3.1ODS設計

存放經過清洗、轉換、標準化以后的數據，并對外提供數據服務。為企業提供統一的數據視圖，滿足業務部門實時獲取數據和業務部門間對企業級的數據共享的需求。因此將ODS設計劃分為兩大部分：數據區、服務區。并按主題進行組織、近實時的集成數據存儲，以便最終用戶能夠快速查詢近期細節生產數據。

1.3.2DW（數據倉庫）設計

數據倉庫模型分為兩個區域：核心數據區（企業核心數據歷史細節區域）和輕度匯總數據區。核心數據區的數據模型設計依據企業數據模型進行設計，但是每個實體都要加上相應的時間戳。核心數據區的模型相對穩定。輕度匯總數據區的模型設計依賴于分析需求。數據倉庫模型是符合3NF的帶有時間戳的關系模型。具體操作時應對數據倉庫需求進行分解，按業務主題進行組織，將業務主題相關的數據組織成主題域，并對各指標進行分析。

1.3.3DM（數據集市）設計

數據集市的數據分為兩類：一類是基于數據倉庫的細節數據或輕度匯總數據進行的統計分析，另外一類數據是基于統計分析進一步分析挖掘的數據。數據集市的建模方法是通過調研企業經營的戰略目標、綜合查詢分析系統、同業對標系統、業務管理目標、業務報表等，對這些資料進行分析。根據一體化平臺關于分析主題進行細化，構建統一的核心數據集市模型。數據集市模型采用星形模型建模。

1.4元數據管理設計

元數據存儲在專用的數據庫中。有一類獨立于其它工具，被稱為元數據知識庫（MetadataRepository）的工具，它們為元數據提供一個集中的存儲空間。本設計中采用基于OracleOWB（OracleWarehouseBuilder）的元數據管理方案，各個工具集中通過OWB進行管理其中，元數據管理流程主要包括：元數據獲取流程（手動和自動）、元數據訪問權限管理流程以及元數據流程。元數據知識庫通過元數據獲取流程，來整合多個源（工具、數據庫和流程）中的不同元數據。通過元數據獲取流程，將元數據存入知識庫中后，為了有效的維護和管理元數據，保持其對于整個數據倉庫系統的有效性、準確性和及時性，還需要完成許多管控工作。元數據的方式有很多種：包括從屬關系圖（dependencydiagrams），數據沿襲表（datalineage），影響分析（impactanalysis），高級搜索，柔性報表，元數據術語表等。在實際工作中，應該有一套具體的流程來使用這些元數據方式，使得用戶的查詢請求能得到及時有效的反饋。

篇（4）

1.引言

隨著鹽城經濟的迅猛發展，鹽城電網也在加速建設，越來越多的變電站相繼投入運行，電力調度控制中心所需監控的信息量也隨之增加。與此同時，對監控人員的專業技能水平也提出了更高的要求。雖然調度自動化水平日益提高，但能量管理系統還不能完全滿足監控人員的需求。能量管理系統主要通過告警窗來向監控人員提示一些遙信變位、遙測越限等信息量，對即時分析某單一故障提供了較大的幫助，然而該告警系統卻不具備統計分析等功能，給監控人員進行下一步分析帶來不便，圖1所示為能量管理系統的告警窗圖。

圖1 能量管理系統的告警窗圖

為了給監控人員提供更加直觀、豐富的信息量，進一步提高自動化水平，本文提出構建主站實時監控統計分析系統。該系統具備較為系統的統計分析功能，通過對告警信息、三遙信息的統計分析給出監控人員最為關心的幾方面內容，包括：按區域、時間查詢告警信息;遙信頻繁變位數量的統計;遙信吊牌、未復歸信息的統計;廠站工況頻繁投退次數的統計;遙測不變化信息的統計;遙信、遙測是否正確的綜合分析。

將上述一系列統計分析的結果通過一個友好的可視化界面呈現給監控人員，便于他們在遇到電網的缺陷和故障時，做出最快、最合理的解決辦法，從而在一定程度上提高了電網運行的安全性和穩定性。

圖2 主站實時監控統計分析系統的構建圖

主站實時監控分析系統采用B/S模式，即Browser/Server（瀏覽器/服務器）結構，來實現一系列的功能。該系統的研究成果以獨立模塊形式提供給監控人員使用，主要通過對三遙信息、告警信息的統計分析，將監控人員所需要的信息展現出來。其中，服務器是整個系統的核心環節。首先，是信息傳輸的載體。該系統從能量管理系統的三區數據庫中提取所需的原始信息，再將處理過的信息傳輸給監控人員。其次，具有統計與分析功能，是整個系統的“大腦”。對原始數據進行一系列的統計和分析，通過各種算法得出所要求的結果。

2.系統構建

該系統設計思路：系統采用BS架構，利用服務器對數據進行管理操作，BS客戶端用于監控人員的數據讀取，整個系統的架構圖如圖2所示。

3.具體實施方案

3.1 系統數據處理流程

本文在已有的能量管理系統基礎上，增加系統數據統計與分析服務器，實現系統數據的處理。如圖3所示即為實時監控統計分析系統的數據處理流程。下面為整個系統數據的處理流程：

①三區web服務器不間斷同步一區能量管理系統的實時數據，并將同步數據存入三區歷史數據庫中;

②遠程瀏覽工作站利用瀏覽器提供的選項選取自己所需要的數據，并將操作指令發送給服務器;

③服務器對接收到的操作指令進行分析、判斷，同時生成對應的SQL語句并發送到三區web服務器;

④三區web服務器利用SQL語句到三區歷史數據庫中快速查詢對應的信息，并將查詢到的數據返回給服務器;

⑤～⑦服務器結合操作指令，對三區web服務器返回的數據進行統計和分析，并將合理的結果返回到遠程瀏覽工作站的瀏覽器界面中。

圖3 實時監控統計分析系統的數據處理流程

3.2 數據的自動統計與分析

數據統計與處理服務器主要用于對接收到的操作指令進行分析、判斷，同時將生成的SQL語句發送到三區web服務器進行數據調取。為方便調控人員對電網的監控，主要提供以下幾方面的內容：

（1）綜合統計;該功能主要將一個星期內電網出現的事故、異常、遙測越限、變位、告知這五類型號進行一個量化的統計。

（2）綜合分析：該功能主要對一個星期內電網出現的事故、異常、遙測越限、變位、告知信號進行分析，并與前段時間進行一個比較，分析電網的安全性及可靠性。

（3）操作統計：可按選取的時間間隔統計遙控、遙調的操作次數。

（4）遙信正確動作次數統計：對遙信的動作次數進行統計，并結合一系列其他遙測、遙信量分析此次動作是否正確。

（5）重載超載：結合提供的變壓器信息，分析當前的是否處于重超載狀態。

……

這些內容的展示給監控人員處理日常的故障及缺陷提供了很大的便利性，大大提高了工作效率，并從一定程度上提高了電網運行的安全性和穩定性。

3.3 客戶端顯示

主站實時監控分析系統最終通過客戶端將結果展示給用戶，為用戶提供了一個較為直觀的界面。在這樣的界面中，監控人員可以清晰的看到遙信頻繁變位數量的統計;遙信吊牌、未復歸信息的統計;廠站工況頻繁投退次數的統計;遙測不變化信息的統計;遙信、遙測是否正確的綜合分析等一系列的信息。圖4所示為主站實時監控統計分析系統的客戶端顯示界面。

圖4 實時監控統計分析系統的客戶端顯示界面

4.結論

隨著對電力可靠性要求的不斷提升，通過告警窗來向監控人員提示一些遙信變位、遙測越限等信息量的模式已經不能滿足監控人員的需求。告警窗只能對即時分析某單一故障提供了的信息量，然而該告警系統卻不具備統計分析等功能，給監控人員進行下一步分析帶來不便。為了給監控人員提供更加直觀、豐富的信息量，進一步提高自動化水平，本文提出構建主站實時監控分析系統。該系統具備較為全面的統計分析功能，通過對告警信息、三遙信息的統計分析給出監控人員最為關心的一系列內容。同時，將統計分析的結果通過一個友好的可視化界面呈現給監控人員，便于他們在遇到電網的缺陷和故障時，做出最快、最合理的解決辦法，從而在一定程度上提高了電網運行的安全性和穩定性。

參考文獻

[1]馬堅.淺談基于B/S架構下的科技項目管理系統[J].青海科技，2011（06）.

[2]曾寶國，程遠東，曾妍，胡鋼，潘鋒.基于PDA的B/S架構基站維護系統研究[J].物聯網技術，2011（07）.

[3]車國芳，柯學.提高配電網供電可靠性的方法[J].中國電力企業管理，2011（10）.

[4]梁偉.提高供電可靠性的策略分析[J].河南科技，2011（24）.

篇（5）

[中圖分類號]　R195.3[文獻標識碼]A[文章編號]　1672-4208(2010)09-0030-02

隨著社會經濟的發展，人們工作、生活、衛生設施不斷改善，醫療水平逐步提高，死因譜也相應發生了變化。為了解威脅居民生命和健康的主要疾病及其影響因素，更好地防病治病，現將我院2007～2009年死因網絡直報的1003例死亡病例進行統計分析如下。

1　資料與方法

1.1　資料來源2007～2009年我院死因網絡直報的《醫學死亡證明書》。

1.2　方法依據國際疾病分類標準(ICD-10)，對2007～2009年我院死因網絡直報資料進行統計分析。

2　結果

2.1　死亡人數及性別比2007～2009年我院網絡直報死亡病例1003例。其中男性652例，占65.00％，女性351例，占35.00％，男女性別比為1.86：1。

2.2　年齡構成死亡人數最多的年齡組為70～79歲組，占26.82％；其次為60～69歲組，占17.05％；最少的為10～19歲組，占1.79％。死亡病例中最小年齡3 d，最大年齡98歲。各年齡段死亡人數及構成比見表1。

2.3　職業分布以離退人員多見，其次為農民和家務待業者，分別占25.02％(251／1003)、15.85％(159／1003)、12.76％(128／1003)。

2.4　死因順位1003例死因報告病例中，惡性腫瘤、循環系統疾病、呼吸系統疾病占前3位，占全部死亡病例的77.37％。死因順位及構成比見表2。

篇（6）

1 引言

《檔案管理》創刊于1986年[1]，連續入選中文核心期刊，刊發了大量高被引的論文，備受業界關注。為客觀準確地反映《檔案管理》2012年的載文情況，作者對當年刊發的全部文章進行了各項統計。為確保統計數據的準確，對關鍵詞作了必要的規范，歸并了重復引文，剔除了無文獻來源的注釋性引文，并對全部引文逐一進行了核對，修正了引文中的差錯。

2 統計分析方法

利用文獻計量學的方法，對該刊2012年刊發的文章從欄目發文量、作者及地域和機構、主題、基金論文、引文類型及年代分布等方面進行統計分析，運用CNKI檢索了被引情況。根據載文實際和統計分析的需要，作者統計分析不含“通訊”、“卷首語”、“文摘”等欄目的文章，主題統計分析不含無關鍵詞的文章，引文統計分析不含無參考文獻或參考文獻類注釋的文章。

3 載文統計分析

3.1 載文欄目發文量。2012年《檔案管理》設置有“卷首語”、“理論探討”、“爭鳴”、“業務研究”、“局館長訪談”、“專題沙龍”、“調查報告”、“海外采風”、“工作園地”、“史料鉤沉”等18個欄目，共刊發文章277篇，表1是主要欄目的發文數量。發文量集中于“工作園地”、“業務研究”、“調查報告”和“理論探討”四個欄目（表中單列了占比）。

3.2 作者分布。作者統計針對“工作園地”、 “業務研究”、“調查報告”、“理論探討”、“海外采風”等9個欄目的242篇文章，其中獨著210篇，兩人合著28篇，三人合著4篇，分別占統計文章的86.78%、11.57%和1.65%。

3.2.1 作者發文數量。最多的發文6篇，共兩人，發文3篇以上的作者共12人（“+”后為第二作者發文數），另有馬帥章等28人發文2篇（含非第一作者）。

3.2.2 第一作者地域分布。以第一作者發文最多的為河南作者（168篇），其次是北京（9篇）、山東和上海（各8篇），發文作者涵蓋了19個省市。河南省又以鄭州、開封、濮陽作者發文數量居多（105篇）。

3.2.3 第一作者機構分布。由于有些文章作者單位不夠具體，對統計數據的準確性有一定影響。242篇文章中，各類院校和各級各類檔案館（局）的作者占比較高，分別發文102篇和82篇。

3.3 主題分布。關鍵詞是從文獻的標題、摘要和正文中選取的，能夠反映文獻的主題[2]，因而選用關鍵詞進行主題分析。2012年《檔案管理》中有關鍵詞的107篇論文共有關鍵詞401個，篇均3.75個。涉及關鍵詞305個，最多的僅出現8次，可見分散度較大。為較好地反映文獻主題，可將表達相同或相關概念的關鍵詞進行必要的統一，如將“檔案館”、“檔案局”、“檔案部門”等統一為“檔案館”。規范統一后，利用自編的軟件處理得到以下統計結果。

3.4 基金論文。2012年基金項目論文共25篇，基金論文占比超過10%。其中，河南省檔案局科技項目《轉變檔案行政管理職能研究》、《檔案執法理論與實踐研究》各發文3篇，河南省檔案局科技項目《檔案立法技術研究》發文2篇，基金發文量如表4所示。

3.5 引文統計。2012年《檔案管理》文章中，列有參考文獻、參考文獻類注釋的論文96篇，共有引文725條（其中外文13條），篇均引文7.55條。從年代分布看，2005年后的引文數量占66.62%。引用文獻類型中，期刊論文最多，占比達70.62%，其次是電子文獻、圖書和學位論文。表5列示了引文的年代分布（“其他”為1980年前或無法確認年代的）。

引用文獻中的期刊論文共涉及期刊139種，其中以檔案類期刊為主，排在前9位的都是檔案核心期刊，其次是非核心檔案類期刊和圖書情報類核心期刊。

3.6 被引統計。通過中國知網檢索，截至2013年4月23日，2012年《檔案管理》刊發的被引論文達25篇，其中《中部六省市級檔案網站評估指標體系的構建及評估結果分析》被引3次，《淺談事業單位檔案的信息化建設》等兩篇各被引2次。表6列示了十種檔案學期刊2012年發文及被引情況。

4 結論

通過以上統計和分析，可以得出以下基本結論。

4.1 從欄目發文分布看，“工作園地”、“業務研究”、“調查報告”和“理論探討”四個欄目是發文主體，“工作園地”和“業務研究”兩欄目的發文量超過發文總數的一半，表明《檔案管理》特別注重結合工作實際，與其“以業務指導為主，兼顧學術性和可讀性”[1]的定位是一致的。

“卷首語”是許多檔案刊物共有的欄目，但《檔案管理》六篇卷首語的內容均為“檔案依法行政管理”，對做好檔案工作有很強的針對性和指導性。

4.2 載文中獨著文章居多，發文2篇以上的作者超過40人，他們獨立或合作發文的數量超過100篇，表明《檔案管理》已形成較為穩定的作者隊伍。但作者以個人自由研究為主，論文合作程度偏低[3]。

發文作者的地域和機構數據表明，《檔案管理》立足河南，面向全國。注重反映本省的研究成果，注重各級各類檔案館（局）的業務交流，不斷傳播和促進學術研究。發文作者集中在各級各類檔案館（局）和各類高校，反映了這兩個系統科研能力較強[3]。

4.3 從關鍵詞的詞頻可以看出，《檔案管理》2012年特別注重刊載“檔案執法”、“檔案法規”和“立法”方面的文獻，同卷首語的內容相呼應。此外，“檔案館”、“檔案”、“檔案管理”、“檔案鑒定”、“檔案服務”等也是刊載的重點，有很強的實際工作指導價值。但列有關鍵詞的論文偏少，在一定程度上影響了主題統計結論的準確性。

4.4 基金項目多為與檔案工作相關的省部級以上項目，基金項目級別較高。基金論文占比雖不算高，但針對性很強，較充分地反映了檔案科研特別是檔案執法和立法研究方面的最新成果。

4.5 引用文獻表現出期刊論文多、核心期刊論文比重大、引用年代新的特點，表明刊載的論文注重高水平檔案學研究成果的吸收，注重圖書情報領域研究成果的借鑒，同時廣泛吸納其他學科的成果。但列有引文的論文偏少，有些著錄不準確，外文引文較少。

4.6 盡管統計的時間段較短，而論文的被引和被引率均有較大的滯后性[4]，但截至2013年4月23日的2012年載文被引同其他檔案類期刊2012年載文被引的對比表明，《檔案管理》有較高的被引量，一定程度上反映了該刊在檔案類核心期刊中有較高影響力。

參考文獻：

[1]《檔案管理》雜志社.《檔案管理》簡介[EB/OL].（2011-04-25）[2013-04-01].http：///w_NewsShow.asp？ID=0：2628.

[2] 倪麗娟，于淑麗.檔案學研究熱點分析——基于2004～2008年《檔案學研究》、《檔案學通訊》論文關鍵詞的詞頻分析[J].檔案學通訊，2010（1）：19～22.

篇（7）

中圖分類號：X734文獻標識碼： A

公路行業作為國民經濟的一個重要組成部分，是促進國民經濟發展的基礎設施。公路事業的發展，對于調整國家生產布局和產業結構，開拓市場，加強城鄉地域交流，開發城鄉經濟資源，促進貧困地區經濟發展，改變偏遠地區的落后狀況，提高人民生活質量，增強國家經濟實力等方面起著巨大作用。近年來，由于我國構建社會主義和諧國家，加快了全面建設小康社會步伐，加大了對交通基礎設施建設的投入，特別是公路投資結構區域多元化，涉及到國省縣鄉公路，公路統計的范圍更加廣泛，對作為公路管理基礎工作的公路統計工作要求更精細、更規范、更系統，要求統計數據的質量和實效性也越來越高。

公路統計是公路建設和養護工程中的一個重要組成部分，是公路管理的一項重要的基礎性工作，其基本任務是對公路的建設、養護和使用情況進行統計調查，對公路經濟活動提供信息資料并實行統計監督，為制訂公路交通規劃和公路建設養護計劃提供依據。在公路事業發展的今天，公路管理也發生了根本性的變化，公路統計工作只有不斷提高工作效率，更好地研究、運用各項統計數據為公路建設養護服務，才能適應公路管理發展形勢的需要，科學有效的公路管理是公路事業發展的保證。

一、公路統計分析工作的必要性及重要性

（一）社會經濟發展的需要

隨著社會經濟發展的加快，交通是否發達是衡量一個地方經濟發展情況的重要指標，從而各地根據路況不同程度地對舊路進行改造及根據規劃增加新的公路建設。在公路工程項目建設中，工程的進度、質量和效益是業主和施工單位共同追求的目標。如何搞好公路工程建設期的統計，形成全面有效的統計信息系統，是公路工程建設時期的重要內容。更是檢驗公路建設各項工作成敗得失及合理調配建設資金，制訂規范化管理條例的重要依據；做好公路統計工作是全面搞好公路管理工作的基礎，是公路交通重要的管理和決策依據。

（二）公路建設和養護管理體制深化改革的需要

在當前市場經濟的環境下，公路投資結構趨于多元化，各種經濟實體的變換和利益交錯，必然給搜集、整理、研究和提供各種公路經濟活動的公路統計工作帶來一定的變化和影響。公路統計的范圍更加廣泛，涉及到高速公路、國省道干線公路、縣鄉公路和農村公路等。公路指標體系、統計方法與以往相比有很大不同，要求更精細、更規范，更系統，統計數據的質量和時效性要求也越來越高。

（三）建設公路統計管理信息化的需要

搞好公路統計管理信息化，是加快實現公路現代化的必然選擇，它能從根本上突破和改變舊的公路統計管理方式和手段，提高公路管理的效益和技術水平。隨著計算機技術在公路部門的普及應用，公路統計作為信息處理技術的核心部門，其公路建設和養護的大量統計數據，涉及到公路基礎數據、路政管理等方面內容，需要平時及時錄入信息，大量統計數據均采用計算機技術進行處理，形成各種報表，有關公路數據庫的建立、更新、完善任務更加急迫繁重，

（四）公路發展、決策管理的需要

公路統計在公路科學管理過程中扮演著不可替代的角色，近年來，隨著我國加大對交通基礎設施建設的投入，公路建設事業正以前所未有的速度向前發展，公路投資結構趨于多元化，公路管理的范圍更加廣泛，涉及到高速公路、國省道干線公路、縣鄉公路和農村公路等方方面面，公路指標體系、統計方法與以往相比有所不同，要求更精細、更規范，更系統，統計數據的質量和時效性要求也越來越高。

由于公路統計指標具有較強的系統性和完整性，不僅為制定公路發展方針政策、公路養護建設計劃和管理法規提供依據，而且為科學組織公路生產，加強公路部門的內部經濟核算提供依據。公路愈發展，愈現代化，愈需要依靠統計數據，因這通過對統計資料的分析，揭示公路發展規律，反映公路養護和建設實際，從而制定出與市場相適應的管理政策和法規，以保證公路業健康有序發展。對做好公路統計工作的思考隨著我國經濟社會和公路建設的快速發展，政府、行業、社會公眾對統計數據的及時、準確、方便性要求越來越高，要做好統計工作首先加強統計基礎建設工作，提高統計人員素質。

二、存在的問題

（一）一些領導認識不足

在實際工作中，一些公路基層單位的領導只憑上級的文件精神和自己的工作經驗來指導生產，沒有形成運用統計數據分析解決問題的工作作風和策略，認為統計工作就是填填數字，幾分鐘就完的事。

（二）公路統計隊伍的專業水平差

公路統計隊伍人員變換頻繁，從事公路統計的人員的敬業精神、文化水平、業務素質不盡如人意，有統計專業技術職稱的很少，兼職統計人員較多，許多統計人員沒有經過專業培訓，便匆忙上崗；上崗以后，也很少進行專業學習，有的僅能完成一般的統計報表，卻不善于搜集、整理、匯總各種資料，使統計資料難以準確地反映客觀情況，統計人員業務素質有待提高。

（三）統計工作中法制觀念淡薄

法制觀念淡薄，統計數據存在較大的隨意性和盲目性。一些單位的領導出于對部門、個人利益的考慮，對數字造假心知肚明，以行政手段干預報表的各項統計數據，統計人員也只能按領導意圖行事。這樣統計數據的隨意性和盲目性就增大，虛報、瞞報、篡改統計數據現象經常存在，如由于公路養護計劃指標逐年都要按比例提高，為了完成指標，編造的數據就失去了統計報表的意義。

三、完善改進公路統計分析工作的措施

（一）加強公路統計工作重要意義的認識

公路愈發展，愈現代化，愈需要依靠統計數據，因為公路統計是揭示公路發展規律，反映公路養護和建設實際，公路統計指標不僅為制定公路發展方針政策、公路養護建設計劃和管理法規提供依據，而且為科學組織公路生產，加強公路部門的內部經濟核算提供依據。當前是信息技術突飛猛進的時代，公路統計涵蓋了公路數據庫管理系統、交通量調查統計系統、路面橋梁管理系統等全方位的現代化公路信息網絡，通過統計數據分析研究公路的經濟活動，是提高領導者管理水平，正確行使領導職責的一項不可忽視的工作。

（二）加強公路統計隊伍建設

穩定的高素質的公路統計隊伍是重點。公路統計工作人員不但要掌握好統計法律法規、統計基礎理論、基礎核算等知識，能夠熟練地應用基建公路統計專業知識、統計方法進行統計調查、統計整理和統計分析，了解統計的任務與過程，掌握公路統計的各項基本技能；還要在數據處理方面，統計工作人員要能熟練、運用計算機錄入基礎數據、匯總數據及進行數據分析。更重要的是要注重“現場調查”，統計人員要及時學習、掌握被統計工程的基本情況，了解公路工程專業知識，定期進行現場調查可以大大提高數據的準確性和統計的真實度。不僅如此還要樹立起有效的用人方法，創造吸引人的環境氛圍還要通過實用各種方法來教育統計人員，要重視提高人員的知識水準。

（三）完善統計法規有關制度

公路統計工作制度是公路統計工作科學管理的重要工作，能夠增加公路統計工作水準。強化監督管理機制，建立和完善統計規章制度。做好公路統計工作，必須要有嚴格的統計管理制度作保證。第一，要建立統計工作領導責任制，這是當前完成統計任務，提高統計質量的一項重要措施。要通過這項制度，一方面促進各單位加強對統計工作的領導，另一方面，切實保證《統計法》的貫徹實施。第二，要積極開展公路統計專項檢查工作，重點對基層原始統計數據進行實地抽查，切實糾正個別統計人員以年度計劃指標、領導意見來填寫各種報表的錯誤現象，做到數出有據，信息準確，提高統計數據的準確性、真實性、可靠性。第三，強化統計工作的行政管理，進一步健全統計工作的考核評比獎勵制度，制訂出公路統計工作標準和評比獎勵辦法，通過綜合性的考核，切實提高統計人員的責任感和積極性，促使公路統計工作進一步走上科學化、規范化、制度化的軌道。

參考文獻

[1]崔海鳳.淺析規范公路統計工作[J].金田.2013,05.

篇（8）

2病案統計工作對計算機網絡技術的應用

在醫院病案統計工作中采用計算器網絡技術需進行合理的配置，同時要想提高病案統計的實用性，需經以下幾個步驟進行性：2.1計算機系統的配置。在醫院病案統計工作中采用計算機網絡技術，促進病案統計工作的網絡化，選取的計算機性能應達到相應的要求，主要包括計算機的硬件與軟件配置及性能，才能滿足需求。從計算機的軟件、硬件配置來看，個人認為在計算機硬件配置上，需采用VGA顯示器，內存應不小于4G，硬盤容量應超過1T，最好選取的容量越大越好，同時對網卡、網線、打印機及服務器均具備一定的要求。而在計算機軟件配置上，需選擇中文WCDOS操作系統，Novel網，操作系統應高于Ms-DOS3.3，且酌情優化病案統計管理的首頁。2.2應用計算機網絡技術。計算機網絡技術應用時應將病案與統計聯網，再經局域網把原始數據傳輸至工作站內統計，且進行審核分析，最后制成相應的表格。該思路看起來比較簡單，但具體實施也需要一定的步驟及流程，個人認為病案及統計工作的流程，具體應包括：（1）病案統計：將病案數據輸入工作站后應進行統計，內容包括：①把病案首頁信息傳輸至工作站；②轉換格式，對操作前應轉換的格式進行統計，以提高效率；③對病案首頁內容進行審核，主要經設置相應條件關卡而實現審核的目的，標準應達到確保數據的準確性與完整性；④對數據進行匯總，并生成報表。（2）病案工作：①對病案進行定期的收集；②對收集的資料進行審核，且進行校對修改；③對病案首頁信息進行編碼；④把病案首頁輸至工作站中。以上所述的病案及統計工作流程均是醫院病案統計工作中應用計算機網絡技術的重要步驟，要想提高計算機網絡化的應用價值，需進一步強化以上步驟的掌握情況。以上全部工作的重點為審核醫院病案首頁數據，審核工作直接關系到病案統計工作的質量。

3病案統計工作中應用計算機網絡技術的價值

計算機網絡化主要是指數字化管理系統，即為促進病案統計的自動化，經過構建文檔一體化，及時歸檔各種病案文件，經計算機技術有效管理病案統計流程，確保病案信息的科學性、準確性及完整性。3.1提高病案統計工作的實用性。因醫院管理的病案信息非常大，這就明顯增大了病案管理工作的難度，少數需長時間存儲的病案信息通常很難保證存儲的完整性，這就導致病案信息的統計工作質量下降，明顯阻礙了醫院的整體發展[4]。隨著近年來計算機網絡技術在醫院病案管理工作中的應用，明顯節省了醫院的物力與人力，使病案統計工作變得更加輕松，明顯提高了醫院物力、人力資源利用的有效性。3.2提高病案管理工作的安全性。病案信息關系到患者的隱私，不同時間、不同人員對病案信息的處理權限也存在明顯的差異，應用計算機網絡技術進行病案統計即采用電子檔案，其采用的實名制明顯提高了病案信息的安全性[5]。采用計算機網絡化系統進行病案統計具有避免非法用戶侵入、權限控制、傳輸及存儲加密等特點，可見病案統計人員在工作時需具備良好的法律意識，做好對病案統計的保密工作，避免泄露隱私。3.3提高病案管理工作的靈活性。應用計算機網絡技術進行病案統計可根據不同需求制定合理的報表格式，提高了統計的靈活性，更符合病案管理的發展需求。而在對病案信息進行檢索時，不僅包括單一檢索條件，還可經多個條件聯合進行檢索，從而明顯提高了檢索的靈活性，更符合醫院各科室的檢索要求[6]。針對突況可經遠程會診，從而實現區域性或全球性的資源共享，給患者的治療爭取時間。3.4提高病案統計的準確性和完整性。因受到醫院規模的影響，針對病案信息的核對與整理難度較高，從而明顯影響了病案統計的準確及完整。而應用計算機網絡技術之后，按照病案首頁信息，分類整理病案，存儲至計算機內再進行病案統計，為了提高統計工作的效率，需按照實際要求轉換信息格式，轉換時需注意保證信息的準確性、完整性，防止數據的丟失，需及時進行處理，然后再審核病案首頁信息，及時糾正其中存在的錯誤。

4小結

總而言之，在醫院病案統計工作中應用計算機網絡技術實現了病案統計工作的信息化、數字化，明顯提高了病案管理工作的質量，對于促進醫院的信息化建設及整體發展具有重要的意義。

作者:尚書一單位:西南大學計算機與信息科學學院

參考文獻

[1]曹靜.醫院病案統計存在問題與對策研究[J].中國保健營養,2016,26(22):394-395.

[2]王佩玉.醫院病案統計中計算機網絡化的應用[J].中國保健營養,2016,26(33):369-369.

[3]陳靜嫻.對醫院病案統計工作存在的問題的探討[J].中國保健營養(上旬刊),2013,23(4):2177-2178.

篇（9）

統計工作的最后一步是撰寫統計分析報告，分析報告是發揮統計整體功能、表現統計成果的重要步驟，其有利于發現統計工作中存在的問題。

一、統計分析報告的特點類型

統計分析工作的特點就是數量性，因此統計分析報告就是用數字說話，以事實描述，然后進行議論分析。統計分析報告用簡潔的語言表述豐富的統計內涵，做到語言簡練意賅。這種獨特的表達方式也說明了與其它文體的顯著差別。

（一）統計分析報告的特點

1.統計分析報告的是基于大量的調查數據，既要有數據又要有分析，即要提出問題又要有解決問題的措施，因此統計分析報告要比總結報告更加精準。

2.統計分析報告要求從更寬的面上交代背景，用較多的篇幅和事實系統集中地闡述問題、解剖矛盾，比新聞報道更全面具體。

3.統計分析報告必須運用大量的數據材料揭示規律性，在論證文章觀點闡述某種看法時比學術論文更側重用數據、事實說話，深入淺出，虛實結合。

（二）統計分析報告的類型

統計分析報告的類型有許多種，下面就幾種經常使用的類型略作說明。

1.進度型統計分析報告。進度型統計分析報告也被稱為定期統計分析報告，其分析目的是為了讓企業管理階層能偶實時了解工作的進度和檢查企業計劃的實施情況，其一般按周、月、季度等編寫。

2.專題性統計分析報告。是利用統計資料，進行分析投資建設中的某一方面、某一環節而深入研究編寫的分析報告。

3.預測性統計分析報告.是在分析過去和現在的大量準確的統計資料基礎上、運用統計預測方法、對未來發展趨勢做出較為合理的判斷和數量預測，它具有數量性、預見性、差異性、可控性的特點。

二、統計分析預測

電力企業的統計工作具有大量的數據優點，除了對其進行統計分析之外，對電力企業來說更要充分的利用統計分析進行供電情況進行預測，更重要的是對電力的負荷的調研和分析。

伴隨著我國用電結構的調整我國的電力供需矛盾得到一定程度的緩解，國內各大電網負荷特性也都發生了根本性的變化，電網運行的特性是電力負荷的特性趨向于正常。各大電網集團的的最大負荷普遍持續高速的增長，電力峰谷差率增大，負荷率下降，水源枯水期和電力高峰期電力供應緊張，電網的調峰難度增大，對電網的正常運行帶來很大的安全隱患，因此，對電力負荷的統計、分析和預測對電力企業來說越來越顯的重要。

下面論述的是對電力負荷的預測和預警的相關指標，包括了一些還正處于在探索和實踐的指標。(1)日最大電力負荷，一天之中電力負荷最大的一段。電能表的計量有一個小時、半個小時、一刻鐘和瞬間負荷，日最大電力負荷一般采用的是整點的最大負荷。(2)日平均電力負荷，每天電力用量除以24小時得到的日平均電力負荷。(3)日最小電力負荷，一天之中電力負荷最小的一個時間段，和日最大電力負荷一樣，其一般使用的也是整點的電力最小負荷。 (4)月內最大三日平均電力負荷，任意月份內電力負荷最大三日的平均值，也即是每一月內，取電力負荷最大三天中的整點的最大電力負荷，求這三天的平均電力負荷值，該值即是在這個月中的最大三日平均值。對電力負荷的實際分析中，電力的最大負荷是一個最高水平的狀態，并不是偶然的電力負荷，其既具有代表性。發達國家一般都是采用月內最大三日平均值最為最大電力負荷。 (5) 日負荷率(γ)，反映一天內的電力負荷平復程度，是日平均電力負荷和日最大電力負荷的一個比值，一天之內若負荷的變化比較大，則日負荷的曲線就會陡峭，日電力負荷率越低，反之則越高。 (6) 日最小負荷率(β)，反映一天內的負荷變化的趨勢，是日最小負荷和日最大負荷的比值。一般為了滿足電網調峰的需要，在分析電網調峰能力時通常使用的是接近或者是最小的日最小負荷率（去除節假日外），而并非采用平均最小負荷。(7)日峰谷差率，是日最大電力負荷除以日最大電力負荷與最小負荷的差值所得的數值。和日最小負荷率均值一樣日峰谷差率反映的也是一天內的電力負荷變化的幅度。

(8) 月不均衡系數(σ)，是指平均日電力負荷和該月份內最大日電力負荷的比值。(9)季度不均衡系數(ρ)，是指全年各月最大電力負荷的平均值和該年份內最大電力負荷的比值。其主要反映的是全年內月最大負荷的不均衡性。 (10) 年平均日負荷率(γav)，指的是全年內日電力負荷的一個平均值。 (11)年平均月負荷率(σav)，指的是全年每個月份的日平均電量的總和與全年每個月份的最大日電量總和的比值。

三、結論

總之，對電力負荷進行統計分析是有效防范電力企業發展風險的重要工作，一直以來受到政府、電力企業和相關部門的高度關注。電力企業的發展關系到我國國民經濟發展，電力統計分析與預測是提高電力企業經濟效益、保障電力工業健康發展的重要手段。在市場經濟體制下研究電力供給與需求的動態變化，及時監測、分析當前和未來電力供需情況具有重要意義。

參考文獻：

[1] 陳春琴. 數理統計分析在電力企業負荷預測中的應用[J]. 華東電力, 2006, (05)

篇（10）

統計工作主要分為統計設計、資料收集、整理匯總、統計分析、信息反饋五個階段，統計工作的前四個階段均是容易產生統計誤差的階段，其中統計分析是統計工作中最關鍵的一步，對信息反饋階段的基礎，它是保證統計工作成果準確性的重要部分。因此，統計分析中的誤差控制顯得尤為重要。

一、統計分析的基本步驟

（一）樣本采集。樣本采集是進行統計分析的前提和基礎，是統計分析的數據來源。樣本采集有不同途徑，首先，通過實驗觀察和測量調查，來直接的獲取到信息的方法。二是通過文獻檢索，閱讀獲得間接信息。樣品采集過程中，除了要注意數據的真實性和可靠性，而且還特別注意兩種不同類型的信息之間的區別：一個連續的數據，也稱為測量數據，是指通過實際測量獲得的數據；二是間歇性的數據，是指類的事情，也被稱為計數數據，等級等屬性點數獲得的計數數據。對不同的樣本數據，在樣本采集的初期就應該進行分別對待，保證后續工作的順利進行。

（二）整理樣本數據。整理數據由統計設計標準的分類收集的數據匯總過程中。由于收集到的數據大部分是無序的，零散的，不系統的，統計進入所需的研究數據核查的目的和要求按照之前的計算，不包括其中的一部分不真實的，然后總結或列表，從而簡化了原數據可視化，系統化，并能反映在初次分配中的數據。

（三）數據分析。分析數據是指整理數據的基礎上，相應的統計計算，獲得的數據分布的總體統計特征的統計結論的過程中，它是核心和關鍵的統計分析。數據分析通常分為兩個層次：第一個層次是用來形容一種方法來計算的統計數據反映的集中趨勢，分散程度和相關的強度與外部代表性的指標，第二個層次是基于描述性統計，并與推論統計方法進行數據處理，以此來推斷總體樣本的信息，并進行分析和推測的整體特點和規律。

二、統計工作過程中誤差控制

（一）統計設計。統計設計是確定統計工作的主要目的、預期達到何種效果的統計流程、規則的重要步驟。統計設計方案要求考慮問題要全面，針對不同的統計目的確定樣本及樣本容量。樣本量的大小不取決于總體的多少，而取決于：1.研究對象的變化程度；2.所要求或允許的誤差大?。淳纫螅?.要求推斷的置信程度。當所研究的現象越復雜，差異越大時，樣本量要求越大；當要求的精度越高，可推斷性要求越高時，樣本量越大。因此，在統計設計階段，合理的確定樣本及樣本容量是減少統計分析誤差的根本條件。

（二）樣本采集。樣本采集過程即統計資料搜集過程。數據的準確性、真實性是確保統計工作順利進行以及統計分析、信息反饋的根本要素。樣本采集過程應注意一下問題：

1.統計調查人員培訓。在進行統計調查之前，統計工作的設計者、組織者應該針對統計調查人員進行一次業務培訓。每一項統計調查都是為統計分析的最終目的服務，為更好的收集統計數據，應該讓統計調查人員透徹理解統計調查的具體規則、必需調查項目以及必須遵守的相應素質，以減少被調查者對統計調查的誤解與抗拒，以此確保統計調查數據的真實性與完整性。

2.調查方式。統計調查有比較實用的調查方式，調查的方式有普查、重點調查、典型調查、抽樣調查、統計報表制度等。具體收集統計資料的調查方法有：訪問法、觀察法、報告法等。具體采用哪種方式，選取的原則就是結合統計調查目的，節省統計調查經費，選取最優的調查方式或多種調查方式相結合。

3.數據完整。統計數據要求各項數據必須完整，如果某一樣本各項數據不完全，就決定該樣本才具失敗，該樣本必須被舍棄，因此，缺失數據項目太多會影響樣本的容量，最終會使得統計調查結果失真，失去統計調查意義。

（三）數據整理。數據整理是對調查、觀察、實驗等研究活動中所搜集到的資料進行檢驗、歸類編碼和數字編碼的過程。它是數據統計分析的基礎。數據整理一般遵循以下流程：

有上述流程可以看出，應該加強數據審查工作，在這一階段，很容易判斷出是否出現人工錄入失誤或數據缺失項等相關問題，減少非系統誤差出現。

（四）數據分析。在統計分析階段，要求統計分析人員熟悉統計調查的目的、數據結構及構成等客觀因素，根據數據的匯總分類等預處理結果，合理地選擇擬合模型。在此階段，應該注意的就是正確看待每一種統計分析方法的假設條件以及擬合優度等理論要求。

三、結束語

在統計設計階段由于設計者不可能完全掌握統計調查對象的總體趨勢，在數據分析階段由于采用擬合模型分析，所以存在一定的系統誤差，而這些系統誤差是不可避免的，只能通過統計專業人員的專業知識進行理論上的優化，降低系統誤差。在數據采集、數據整理階段，只有加強人員培訓、數據審查等辦法避免數據輸入等非系統誤差。同時，在避免非系統誤差的同時也應該審查被舍棄的樣本數據，避免遺漏正常的異常值，導致異常值丟失對調查對象的總體認識的影響。

上一篇: 加強行業稅收管理下一篇: 教育研究實踐