時間:2023-03-02 14:55:03
序論:好文章的創作是一個不斷探索和完善的過程,我們為您推薦十篇excel數據分析范例,希望它們能助您一臂之力,提升您的閱讀品質,帶來更深刻的閱讀感受。
首先,啟動Excel,點擊工具菜單中的“加載宏”選項,在出現的對話框中選中“分析工具庫”,確定安裝后,在菜單欄的“工具”下會出現“數據分析”選項。
2 使用Excel進行數據統計描述
用Excel可進行數據的統計描述,包括:(1)集中趨勢(集中指標),它包括算術平均數,中位數,幾何平均數,眾數等。Excel提供有現成的公式及內置函數可進行這幾個指標的計算。如首先輸入一組數字,然后建入公式=AVERAGE(常數),=MEDIAN(常數),和=MODE(常數),按回車健可得到算術平均數,中位數和眾數;(2)離散趨勢(變異指標),它包括全距,百分位數,四分位數間距,方差,標準差,標準誤,偏度系數和峰度系數等。而其中以方差,標準差,百分位數和標準誤較為常用。同樣在電子表格中建入公式=VARP(常數)和=VAR(常數)兩函數可計算總體方差和樣本方差。建入公式=STDEVP(常數)和=STDEV(常數)便可得到總體標準差和樣本標準差。
3 t檢驗
t檢驗是醫學統計分析中最常用的統計分析方法,用來檢驗標準試樣測定結果的平均值與標準值之間是否有統計學意義。Excel“數據分析”中提供了多種不同條件的t檢驗工具,如“平均值的成對二樣本分析”,“雙樣本等方差假設”,“雙樣本異方差假設”及其他統計分析工具,當樣本中的觀察值存在配對關系時,可以使用“平均值的成對二樣本分析”t檢驗。例如對一個樣本組在實驗前后進行了兩次檢測,為確定實驗前后樣本均值是否相等,應使用成對t檢驗,此t檢驗并不假設兩個總體的方差是相等的。例如,用某藥物治療高血壓患者10名,治療前后舒張壓變化如下:
在工作表中輸入上面的數據,比如數據區為A1至J2。分析時,在“工具”菜單中,單擊“數據分析”命令。在數據分析對話框中,選擇t檢驗:平均值的成對二樣本分析,拉出平均值的成對二樣本分析對話框,其中有如下輸入項:變量1的區域:輸入需要分析的第1個數據區域的單元格引用。該區域必須由單列或單行數據組成。可單擊輸入框右面的按鈕,回到電子表格上自數據開始的單元格向結尾的單元格拖動。此時變量1的區域(A1~J1)自動進入輸入域中。然后單擊輸入域右面的按鈕,回到原對話框。變量2的區域:輸入需要分析的第2個數據區域的單元格引用。該區域必須由單列或單行的數據組成。輸入方法同前。變量2的區域為(A2~J2)。假設平均差:在此輸入期望中的樣本均值的差值。缺省為0值,即假設樣本均值相同。標志:如果輸入區域的第1行或第1列中包含有標志項,應選中此項:如果輸入區域沒有標志項,Excel將在輸出表中生成適宜的數據標志。這里選中此項。α在此輸入檢驗的統計意義水平。該值范圍為0~1之間。缺省為0.05。
輸出區域信息可選擇如下單選項:輸出區域和新工作簿。我們選擇新工作表,結果為平均95.88889,方差80.86111,觀測值9,泊松相關系數0.881366,假設平均差0,df 8,tstat 5.230769,P(T≤t)單尾0.000396,t單尾臨界1.859548,P(T≤t)雙尾0.000792,t雙尾臨界2.306004。兩組比較差異有統計學意義(P
4 方差分析(analysis of variance,ANOVA)和卡方檢驗
在數據分析工具庫中提供了3種基本類型的方差分析:單因素方差分析、可重復雙因素分析和無重復雙因素分析,現簡單介紹方差分析的應用。
單因素方差分析:在進行單因素方差分析之前,須先將試驗所得的數據按一定的格式輸入到工作表中,其中每種水平的試驗數據可以放在一行或一列內,具體的格式如表,表中每個水平的試驗數據結果放在同一行內。數據輸入完成以后,操作“工具-數據分析”,選擇數據分析工具對話框內的“單因素方差分析”,出現一個對話框,對話框的內容如下:(1)輸入區域:選擇分析數據所在區域,可以選擇水平標志,針對表中數據進行分析時選取;(2)分組方式:提供列與行的選擇,當同一水平的數據位于同一行時選擇行,位于同一列時選擇列,本例選擇行;(3)如果在選取數據時包含了水平標志,則選擇標志位于第一行,本例選取;(4)α:顯著性水平,一般輸入0.05,即95%的置信度;(5)輸出選項:按需求選擇適當的分析結果存儲位置。 雙因素無重復試驗方差分析 與單因素方差分析類似,在分析前需將試驗數據按一定的格式輸入工作表中。 數據輸入完成以后,操作“工具-數據分析”,選擇數據分析工具庫中的“雙因素無重復方差分析”,出現一個對話框,對話框的內容如下:(1)輸入區域:選擇數據所在區域,可以包含因素水平標志;(2)如果數據輸入時選擇了因素水平標志,請選擇標志按鈕;(3)顯著性水平α:根據實際情況輸入,一般選擇0.05;(4)輸出選項:按需要選擇分析結果存儲的位置。
可重復雙因素分析:雙因素可重復方差分析與雙因素無重復方差分析數據輸入的區別在于對重復試驗數據的處理,就是將重復試驗的數據疊加起來。 數據輸入完成以后,操作“工具-數據分析”,選擇數據分析工具庫中的“雙因素可重復方差分析”,出現一個對話框,對話框的內容基本與雙因素無重復方差分析相同,區別在于每一樣本的行數選項,在此輸入重復試驗的次數即可。若須對數據進行方差分析時,在輸入區域選擇數據所在區域及因素水平標志,在每一樣本的行數處輸入3,即每種組合重復3次試驗,顯著性水平選擇0.05。在輸出選項中可以按照需求選擇分析結果儲存的位置。選擇確定以后分析結果。在工具菜單中均有現成的這3種分析工具。
5 非參數檢驗
Excel也沒有提供非參數檢驗的分析工具,但可利用其提供的函數和公式可進行分析。如利用IF(指定要執行的邏輯檢驗函數)和COUNTIF( 條件函數 )進行編秩。利用=SUMIF(條件單元格求和函數 )計算正負秩和。=COUNT(個數函數)利用=ABS和=SQRT計算絕對值和z值。
6 相關回歸
為了反映兩個或多個變量之間的關系,描述相關關系的方向與密切程度,需采用相關分析;為了反映兩個或多個變量之間的依存關系,建立回歸方程,采用回歸分析。先將數據輸入工作表中,然后用Excel提供的函數可進行線性回歸(linear regression)又稱簡單回歸的分析和Spearman等級相關分析,用菜單中的“工具數據分析相關糸數可進行相關分析。用“工具數據分析協方差工具可進行協方差分析。用Excel的XY散點圖工具可以進行散點圖的繪制。
Excel是一種使用極方便的電子表格軟件,它有強大的數據管理功能,不僅能夠根據需要分類管理數據信息,能進行數據統計、篩選、排序、匯總、匯制圖表等,還能利用其強大的函數功能以及分析工具庫為建立復雜的統計或計量分析工作帶來極大的方便。
以“格式”選項卡為例,這里提供了數據條、色階、圖標集、大于、文本包含、清除格式等功能按鈕,鼠標移到“圖標集”上,我們會看到不同的圖標風格(如圖1),預覽滿意之后即可應用。“圖表”選項卡則可以預覽不同風格的圖表效果,從而幫助你快速創建相應的圖表,例如使用散點圖(如圖2)。如果需要查看更多的圖表,可以點擊最右側的“更多圖表”按鈕。最常用的操作當然是“匯總”下的求和、平均值、計數、匯總百分比、匯總,相信這也是絕大多數朋友接觸最多的操作。在選擇相應的功能之后,Excel 2013會在相應的位置上添加一行列出所得出的結果,比如平均值(如圖3),點擊“>”按鈕還可以選擇更多的匯總功能。“表”選項卡提供了表、數據透視表、其他等功能選項,可以快速創建非常美觀的圖表。“迷你圖”的效果就不用多介紹了吧?
簡而言之,借助Excel 2013的快速分析工具,我們可以在最短時間內快速實現相應的操作,而且是提供充分預覽,從而提高操作效率。
午后的三點一刻是下午茶的時間,忙碌了一天,現在放下手中的工作,稍稍休息一會兒吧。
首先,我們來聽一首歌,一首很適合在午后時分聽的歌:《Down at the coffee shop》,這是一首甜膩膩的歌,就好像草莓味的水果糖。尾音和間隙處銜接非常緊密,她粘粘的唱,那大家就粘粘的聽吧。再來一杯有著玫瑰香的泡泡水,清淡、回味。就讓一個小清新的午后由此開始吧……
3、方法三:分組對比法。分組之后,我們就可以對數據進行匯總計算了。常見的方法是通過求和、平均值、百分比、技術等方式,把相同類別的數據,匯總成一個數據,減少數據量。
可以對大量的數據進行查詢,其查詢方式為友好的多用戶方式;分類進行數據的匯總,并可以在分類下設子分類來匯總數據,運用函數來設定自定義公式與計算方法;將所關注的數據分級別進行展開與折疊,對重點關注的區域可以查看其明細的摘要數據;為便于查看不同的源數據的匯總,可以講行與列之間進行相互移動;對最重要的數據,首先要進行篩選,再將其排序與分組,同時依照一定的條件進行設置格式,以方便能夠獲取所關注的信息;所提供的聯機或者是打印報表,能夠以帶批注、簡明的方式呈現出來,并且具有吸引力。
2.特殊元素
Excel函數和動態圖表與標準圖表相比較,不但具有坐標軸、數據標記分類與系列這些元素,還具有標準圖表所沒有的以下幾種特殊元素:
(1)以不對分類信息與系列進行修改為前提,對數據子集進行快速匯總與集中處理的捷徑是報表篩選字段,其作用是按照特定的項進行篩選數據的字段。
(2)特殊元素中有一項是值字段,它是產生于基本源數據,為數據分析提供數據來進行計算或者是比較。在報表中使用的各種源數據,匯總函數是最基本的使用,此外,其計算公式也能夠使用其他諸如Product與Count等。
(3)在動態圖表中系列字段是所指定的系列方向字段。在此字段中,獨立數據系列由項提供。
(4)在列或者是行的字段里面項所代表的唯一的一個條目,同時在系列、分類與報表篩選等各字段中式出現在下拉列表中的,項在分類字段里,在圖表上是以標簽的形式顯示在分類軸上的。項在系列字段里是在圖例中列出的,為各數據系列提供名稱。
(5)源數據中在動態圖表中被分配至分類方向的字段是分類字段,能夠提供給在繪圖中應用到的數據點單一的分類。分類在圖表中通常是在水平軸或者x軸上出現。
(6)在動態圖表中,能夠對圖表的類型以及其他的一些選項進行更改的是自定義報表,比如說數據標簽、標題以及圖表與圖例的位置等。
二、Excel函數和動態圖表在會計數據分析方面的實際應用
下面以日常的會計工作為例,介紹Excel函數和動態圖表在會計數據分析方面的實際應用,在會計工作中,通常會有匯總統計數據的情況,比如說:對各種產品幾個月內的總產量以及各項目總成本進行統計匯總,或者對不同種類產品各自的月均產量進行計算。若手工進行統計,在這種情況下,需要將表格內的數據按產品種類進行重新提取再匯總,費時費力不說,出現錯誤的幾率更大,如果運用Excel函數和動態圖表,便能夠準確快捷的解決問題。
1.首先在工作表的菜單中進行動態圖表的創建,同時進行錄入或者從外部導入所需數據源;然后統計匯總字段,并選擇確定行標題與列標題的字段,是選擇進行統計的方式,進行函數的選擇,是求和還是平均值或者最大值等等。在表1中,行標題是產品名稱,列標題是產量與材料成本等。
2.在Excel表格中,對個產品的單項進行匯總計算時,對各項進行拖動至對應行或者列,在對話框中所需的條目中進行釋放。根據所所需結果的不同來選擇拖動次數,如進行材料成本的計算時,要連續的進行兩次的拖動,首次求的是總成本,二次求的是平均成本。
3.在所有的項目均處理完后,進行新建工作表將所生成的圖表進行確定位置,如果想要生成更復雜的圖表,可以將行標題或列標題欄根據需求進行拖動,來對各種不同項目的計算要求進行滿足。
專門的企業會計電算化軟件在處理企業會計數據的過程中實現了流程化,而Excel主要用于實現專門的會計電算化軟件所無法實現的功能,如對企業會計數據的動態處理、預測、分析、加工、統計匯總等。Excel已經在各企業會計核算中有不同程度的應用,但大多是基于會計人員手工操作的,而且多是重復操作, 步驟煩瑣, 這樣既影響了工作效率,又不能快速、準確地生成有價值的會計信息。因此熟練掌握 Excel中內嵌的 VBA技術,不但能提高日常會計工作質量,而且可以Excel VBA加載宏的形式,一次生成特定的工作模板,多次使用,提高了會計日常工作效率,為確保會計信息質量以及試算平衡提供了最基礎的保障。本文利用Excel VBA自動控制數據透視表技術動態生成企業會計科目試算平衡表,以避免電算化會計憑證錄入工作中的錯誤,并比對分析企業會計科目數據在一段時間內的變化特征,以便及時、準確、高效地為領導層提供決策依
三、總結
通過以上分析我們可以了解到,動態圖表可以為用戶進行數據的分析與統計匯總,可以通過它對數據進行各種角度的分析匯總,以圖表的方式,簡明、快捷的得出用戶所需的結果,進行數據的分析與判斷。它是交互式的一種表格,可以利用它快速有效的對大量數據進行匯總,同時進行交叉式列表的建立,在篩選數據是可以以不同的頁面進行顯示,并通過行與列的轉化來對不同的源數據匯總結果進行查看。除此之外,動態圖表還能夠對數據做出匯總、分類匯總以及排序,它的篩選能力以及與函數進行結合將會產生強大高效的數據分析能力。
在實際的工作過程中,Excel函數與動態圖表具有方便快捷、使用靈活等優點,與編程方式相比較,Excel函數與動態圖表在統計計算時則更加省時、省力,編程方式需要將程序進行固定,雖然用起來比較方便,計算也能達到不錯的效果,但是不能直接實現很多的計算方式,比如說在編程方式中求平均值只能求出簡單的平均數,但是無法依據產量進行材料成本加權平均值的計算,但是在動態圖表中,將函數功能與之聯合應用,加權平均值等類似問題就能夠迎刃而解。
參考文獻:
關鍵詞: 藥動學; 數據分析; Excel; PKSolver 1.0
目前在藥動學數據處理方面有很多專業軟件可供選擇,如使用最為廣泛的WinNonlin和3P87/97程序等,使用這些功能強大的專業軟件,即使是常規的藥動學數據處理,也要進行復雜的操作,而大部分新藥研究部門的科研人員往往畏懼于學習專業軟件的操作和設置。Excel是使用最為廣泛的統計軟件,具有界面明晰、操作方便的優點,本研究在充分挖掘Excel的VBA編程語言的基礎上,完全以Excel為平臺,編制了藥動學數據分析程序――PKSolver 1.0。同時,參照國內外權威藥動學數據處理程序的結果,對本程序的藥動學數據計算能力進行了評價,程序操作極其簡單。程序的編制擴展了Excel在藥動學數據處理中的應用,對于擴大藥動學基礎理論的實際應用,提高基層藥動學研究水平具有一定的參考意義。PKSolver 1.0程序目前共包括10個模塊,分別為靜注1室、靜注2室、靜注3室、非脈管1室、非脈管1室(有時滯)、非脈管2室、非脈管2室(有時滯)、非房室模型分析、生物等效性分析(雙交叉)以及緩控釋制劑體內外相關分析。限于篇幅,本研究以靜注2房室模塊為例,簡要介紹本程序的設計思想及編寫過程。
1 材料
11 軟件 Microsoft Excel 2002(Microsoft Corporation); 3P87(The Chinese Society of Mathematical Pharmacology); WinNonlin 4.1(Pharsight Corporation).
12 數據選自文獻[1]中某藥物靜脈推注給藥后在不同時間點測得的血藥濃度時間數據。
2 方法
21 程序的編制
211 操作運行界面的設計 本程序運行界面主要包括4個部分,分別為數據輸入區、結果輸出區、操作設置區以及圖表輸出區。以靜注2房室模塊為例,程序運行界面如圖1所示。其中數據輸入區、結果輸出區以及圖表輸出區的設置較簡單,分別利用Excel程序的內置函數和圖表向導即可完成,不再贅述;操作設置區是控制程序的主要部位,通過在Excel中添加按鈕、按鈕選項、組合框、文本框等控件,利用這些控件可以方便的進行藥動學參數的選擇和設置,并調用后臺程序進行數據處理和結果輸出。
212 前臺數據的計算 利用Excel的內置函數和單元格引用,可以在操作界面上直接計算出很多中間參數,如“ln(實測濃度)”、“預測濃度”、“ln(預測濃度)”、“殘差”以及“權重”等,程序可以在后臺直接調用這些中間參數,運用VBA程序進行模型的擬合和優化,大大提高程序的運行效率,這種“前后結合”的數據處理方式可部分提高程序的運行效率。
213 優化過程的VBA程序編寫 利用VBA語言編寫大部分優化計算過程是本程序的一個特點,盡管各個模塊的數據處理過程各不相同,但總的來說,每個模塊的后臺數據處理都大概分為以下幾部分內容:①輸入數據的基本合法性驗證。主要包括有輸入時間點的順序是否合法、藥物濃度時間點的個數是否足夠用于相應房室模型分析、藥物濃度時間數據是否配對、是否出現不符合實際情況的數值(如負值或者非數字型字符)等等;②待擬合參數的初始值計算及初始值的合理性驗證。參數擬合結果除與優化方法有關,更重要的是擬合參數初始值的選取,選取恰當的初始值不僅僅能夠加快擬合速度,還能夠避免擬合過程中的溢出現象。為獲得相對準確的初始值,本程序的編制過程中進行了大量的嘗試和改進,除運用最為經典的殘數法估算初始值外,在非脈管給藥房室模型分析模塊中還采用了一些經驗設置,能夠較快地獲得非脈管給藥模型參數的初始值。同時,本程序還對計算得到的初試值進行合理性驗證,并根據驗證結果進行參數擬合或者針對數據特征向使用者提出建議,進一步提高模型擬合的成功率;③參數擬合優化。該部分是程序參數求解的核心部分,以計算的初始值為基礎,Excel自帶的SOLVER加載宏為主要工具,基于GaussNewton迭代的尋優法為核心算法,進行參數的優化求解,為避免出現擬合結果數學上最優,但實際藥動學上不合理的情況(如負值參數的出現)。在擬合過程中,對所有參數的結果以及參數間的相應關系進行了相應的規范和限制,從而保證擬合出符合實際情況且數學上最優的結果,最后對優化結果進行合理性驗證;④二級參數及模型判據的求解。根據輸入的藥動學參數、設置的參數單位以及擬合得到的一級參數,求算出15個二級參數,其單位設置和計算公式參見文獻[2],9個模型判據按文獻[3]公式計算,分別為r、SS、WSS、R2、WR2、Rsq、S、AIC、SC,所有二級參數和模型判據均在程序后臺調用Excel內置函數計算。
圖1 PKsolver 1.0藥動學數據分析程序運行界面 略
214 輸出報告的程序編制 好的程序應具有友好的操作界面和簡單的使用方法,利用本程序求得所有參數后,只要在運行界面上點擊“報告輸出”按鈕,即可通過后臺啟動Microsoft Word應用程序,新建Word文件,并自動生成完整的數據分析報告,報告生成速度快且操作簡便。
215 其他模塊的編制 本程序中7個藥動學房室模型分析模塊的編制思路基本一致,非房室模型分析、生物等效性分析以及緩釋制劑體內外相關性分析模塊則根據相應內容進行編制,限于篇幅不再詳細介紹。
22 程序的驗證由于程序的模塊較多,僅選取其中的代表模塊,列出其計算結果進行評價,選取文獻[1]中某藥物靜脈推注496mg給藥后在不同時間點測得的血藥濃度時間數據,分別用3P87、WinNonlin和本程序采用2室模型以1、1/C、1/C^2為權重進行模型擬合,所得結果用于評價本程序計算的二級參數。另外,用三種軟件對此數據分別進行靜注1室、2室、3室模型3種權重進行模型擬合,計算AIC值,用于評價本程序計算所得房室模型判據。用PKSolver程序進行模型擬合和參數求解時,僅需輸入“時間血藥濃度”原始數據,在操作設置區中設置好相應參數,點擊“參數求解”按鈕即可完成所有參數的自動求算,再點擊“報告輸出”按鈕即可以生成完整的報告文件。
3 結果
對文獻[1]數據分別采用3P87、WinNonlin和本程序進行房室模型分析的所有結果見表1和表2,三種程序對數據的擬合結果顯示該程序在房室模型參數求算和模型判別上均和權威藥動學軟件非常接近,所求參數基本一致,應用本程序進行簡單的藥動學數據分析具有一定的可靠性,分析結果基本準確。利用VBA語言編程能夠省去大量的繁瑣操作,用計算機代替手工操作,將VBA語言編程應用到藥學數據處理方面的報道甚少[4],本研究嘗試將VBA語言編程應用于藥動學數據處理,取得了預期的效果。
表1 3P87、 WinNonlin、 PKSolver對文獻[1]數據按靜注二室模型擬合結果的全面比較 略
表2 3P87、 WinNonlin、 PKSolver對文獻[1]數據按不同模型擬合AIC判據的全面比較 略
4 討論
41 程序的核心原理和優點利用本程序進行藥動學數據分析的核心是首先通過前臺界面輸入數據并進行自動初步計算,然后在后臺對數據進行一系列合理性驗證、參數優化求解、計算二級參數、輸出最終結果并自動生成報告文件,所有操作僅需點擊兩個按鈕即可完成,操作非常簡便。本程序完全基于Excel程序內置的VBA語言編制,利用Excel強大的數據處理能力和自動作圖功能,將Excel應用于藥動學數據分析,取得了較好的結果。如表3所示,與國內外常用的藥動學數據處理程序相比,本程序具有界面友好、體積小巧、操作簡單、結果輸出直觀方便等特點。特別是本程序充分挖掘了Excel編制宏程序的自動操作潛力,代替手工操作分析數據,將一系列藥動學數據處理步驟全部集中在一個按鈕上由計算機一步完成,不僅極大的提高了使用方便性,還能避免由于手工處理數據可能帶來的錯誤,這在生物等效性分析和緩釋制劑體內外相關性分析模塊中表現尤為突出,這也是本程序優于一般藥動學處理程序之處。
表3 國內外主要藥動學數據處理軟件部分功能特點的比較 略
42 程序的改進本程序在模型參數的優化時僅能使用GaussNewton迭代尋優法和共軛法兩種方法,運用直觀簡潔的Simplex法或者Marquardt法[5]進行參數優化的VBA程序正在開發之中。另外,PKSolver 1.0目前的版本僅包括最常用的10個模塊,更多的藥動學數據分析模塊正在開發之中,相信通過進一步優化算法、增加模塊有望使本程序的數據分析能力不斷完善,從而為藥學工作者提供一個操作簡單的智能化藥動學數據處理程序。致謝: 感謝美國Pharsight Corporation提供藥動學軟件WinNonlin 4.1試用版!本論文在軟件試用期內完成,我們正考慮通過申請PAL (Pharsight Academic License)計劃獲得軟件注冊。
參 考 文 獻
1 Gabrielsson J, Weiner D. Pharmacokinetic and pharmacodynamic data analysis:concepts and applications. Stockholm, Sweden: Swedish Pharmaceutical Press, 1994,129.
2 Gibaldi M, Perrier D. Pharmacokinetics, 2nd edn. New York: Marcel Dekker, 1982,2~108.
用友、金蝶等財務軟件以及企事業其他信息系統的應用和普及,大大提高了中小企事業單位會計信息化程度,減輕了會計人員的負擔,節約了財務成本。但實務工作者也發現,財務軟件更偏重于會計賬務的處理及標準財務報表的提供,而分析功能不足,未提供良好的分析工具,分析方法也不夠靈活,其他信息系統更偏重于業務處理。這時就需要借助EXCEL等外部工具進行個性化的財務分析。
一、財務分析數據庫的構建
用EXCEL建立財務分析數據庫時,可以充分發揮其靈活性,從各個維度、各個層次對企事業單位數據進行分析。盡管EXCEL2007已經解除了以前版本只能處理65 536行數據的限制,但是也要考慮到數據庫如果過于龐大,運行速度會降低。因此,建立數據庫時如果數據庫偏大,可以將數據庫拆分成幾個小的數據庫。
明確了數據庫的構建目標后,就可以從不同地方收集財務分析數據。這些數據既可以從用友、金蝶等財務軟件獲取,也可以從企事業單位的其他信息系統導入,如醫院的HIS系統、藥品管理系統、材料進銷存系統等等。導入的數據既可以是用友等財務軟件整個科目數據,也可以是固定資產數據等等。
財務軟件和其他信息系統一般都有導出成EXCEL電子表格的功能,如果這些信息系統軟件可以導出成分隔符區分的文本文件,也可以通過EXCEL中的分欄工具進行拆分。
(一)基礎數據字段整理
在進行基礎數據整理時,經常會用到這些函數:
1.時期處理函數。如根據日期提取年、月、周的數據:YEAR(),MONTH(),WEEK()。
2.字符處理函數。如提取字符串中的某一內容:LEFT(),MID(),RIGHT()。字符串聯結:CONCATENATE()。
3.數據格式轉換函數。如將數字強制轉換成文本:TEXT()。
4.邏輯判斷函數。如條件判斷:IF()。信息提取:ISNA(),ISTEXT()。
(二)數據的歸類
財務分析時經常會對數據進行分類,這時可以借助函數VLOOKUP()來實現。如對食品進行分類時,可以首先建立一張字典表,如表1。
然后在數據庫里面在目標單元格輸入函數vlookup()并設置函數參數,再對整個字段進行填充,就可以根據字段食品名稱獲取其對應分類了。
(三)數據庫的定義
數據收集整理完后,可以在EXCEL里形成一張表單(sheet),可將有數據的區域定義為一張表,并為之命名。本文以醫院收入分析數據庫為例,基礎數據通過醫院用友、HIS系統收集整理后,存放在一張名為“醫療收入”的表單內。這時先選擇所有數據區域,點擊右鍵,選擇“命名單元格區域”,命名為如“數據表”。
定義數據區域可以更方便地對數據庫進行維護。建立的數據庫如圖1。
二、財務數據的分析
數據庫建立好之后,就可以充分利用EXCEL的數據分析挖掘工具,靈活方便地對數據進行分析。下面介紹幾種常用的分析方法。
(一)對比分析
建立的數據庫如果包含了一段時期的數據并進行歸類后,可方便地實現對比分析。這里面需要用到EXCEL的數據透視表工具,首先將光標定位到“數據表”,單擊“插入數據透視表”,并根據需要選擇報表篩選字段、行標簽、列標簽字段以及值字段。在作對比分析時,應該在列標簽選擇時間字段,并選擇需要進行對比的時間段。
透視表建立后,可以通過報表等字段篩選數據的范圍,例如既可以看全院收入,也可關注某一個或幾個科室的收入分析。同時,在鄰近單元格建立公式對數據進行比較分析。建立的數據對比分析如圖2。
(二)趨勢分析
趨勢分析也是財務分析中的一個常用方法,分析人員可以從數據變化趨勢看出數據的長期變化趨勢及季節趨勢等。
用EXCEL建立趨勢分析時,也要建立數據透視表并選擇要分析的字段。作趨勢分析時,可以輔以圖片更能直觀地進行分析。將光標定位在數據透視表內,單擊“插入折線圖”或其他圖形模板,并調整圖形格式就可以制作出專業的圖表。如圖3。
(三)結構分析
結構分析可以看出數據之間的構成分析。在EXCEL里面作數據的結構分析時也可以通過建立數據透視表,選擇要分析的數據字段進行分析。同時,還可以制作數據餅圖等進行直觀的觀察分析。數據的結構分析如圖4。
三、財務分析數據庫的維護與更新
財務分析數據庫建立完成后,可以根據個性需求靈活地對數據進行抽取和分析。同時,這個數據庫也是可以動態更新的。更新數據庫時,只需在數據表末端追加數據記錄,數據庫就會智能地將數據加入。當然,這個數據庫也支持對以前數據記錄進行修改,批量修改數據時可以使用EXCEL的批量替換功能;具備支持增加和刪減字段的功能。
修改數據庫后,應確保增加的記錄在數據表內可以通過擴大數據表區域來實現。同步更新數據透視表和數據圖時,只需要在任意表內,單擊“更新數據源”,則所有基于數據庫的透視表和數據圖都可以同步進行更新,操作非常方便。
從上述研究可以看出,EXCEL具備靈活、簡便而功能強大的數據分析和挖掘功能,而基于EXCEL數據庫的維護和更新也非常簡單,財務人員通過簡單的操作,就可以從各個維度、范圍對財務數據進行深入的分析。當然,EXCEL還具備更多的數據分析潛能,需要財務人員在工作中發揮主動性和創造力,從而提高財務分析的效率和作用。
中圖分類號:TP39 文獻標志碼:A 文章編號:1674-9324(2012)03-0176-02
在實際問題中,我們經常遇到各種數據需要處理,往往要涉及許多繁瑣的計算與各種統計圖表的繪制。若不熟悉數據處理的方法和專業統計軟件的使用,單憑手工操作進行,不僅工作量大,效率低下,而且容易出錯。我們這里使用常用的辦公軟件――Excel軟件的數據分析功能,快速分析統計學生成績,有利于提高我們的教學水平。
一、使用“數據分析”功能的基本方法
Excel提供了“數據分析”工具包,包含常用的方差分析、描述統計、直方圖、回歸分析、t-檢驗等分析工具。若要使用這些工具,應先單擊“工具”菜單中的“數據分析”。首次調用,需先加載宏“分析工具庫”。步驟如下:
1.在“工具”菜單上,單擊“加載宏”。
2.在“可用加載宏”列表中,選中“分析工具庫”框,再單擊“確定”。出現“數據分析”菜單。
3.選擇“工具”菜單中的“數據分析”,出現“數據分析”對話框,單擊要使用的分析工具的名稱,再單擊“確定”。
二、分析學生成績繪制頻率直方圖的基本步驟
我們以2010年級某專業同學某門課程期末成績為例,我們來討論繪制頻率直方圖的主要步驟:
(一)輸入數據,進行區域排序
為方便起見,將82個數據以矩陣形式輸入到學生成績統計表中,存入Excel的工作表中的適當區域。
學生成績原始數據:
將學生成績數據存放后,利用SMALL函數進行排序,排序公式SMALL(數據存放區域,ROW(Amn)*k+column(Amn)-mk-(n-1)),Amn為存放第一個數據所在位置,k為排序后每一行存放數據個數。任選新的區域存放排序后數據,選橫拉k個數,再下拉,直到數據排序完畢。得到如下成績表:當然也可以把學生成績輸入為一列,再利用Excel排序功能進行排序。
(二)點擊工具數據分析描述統計,選定原始數據列存放形式,任選結果輸出區域,得到統計描述結果
從中看出,82個學生平均成績為73.89分,方差為307.18.
(三)計算極差R
最大的數據減去最小的數據
R=xmax-xmin=99-18=81
(四)分組
1.根據要求,不及格為0~59分,及格60~75,良好76~89分,優秀90~100分。
2.確定分點。
左端點,右端點為b,所表示區間范圍:
(五)生成頻數分布表和直方圖
1.打開“工具/數據分析”,在分析工具窗口中選擇“直方圖”;點擊確定。
2.在直方圖彈出窗口“輸入區域”輸入數據方陣“82位學生成績數據位置”:
在“接收區域”輸入分組右端點所在列區域:
3.在輸出選項中,點擊“輸出區域”,表示頻率數表輸出存放區域,位置任選。
4.在輸出選項中,點擊“圖表輸出”。其他選項,若沒需要,可以不選。
點擊“確定”按鈕,立即顯示如下所示的頻率分布表(表1)和直方圖(圖1)。
圖1
注:1.此圖表中的“頻率”實乃頻數,所以應將表中“頻率”改為“頻數”,接收區改為相應分組文字,得表2
2.直方圖是按照左開右閉的方式對落在各區間的數據進行頻數統計繪制的;
3.從直方圖來看,學生成績基本符合正態分布。
(六)修改頻率分布表
另存表(2)為表(3),將表(2)“頻率”改為“頻數”,并在頻數列右側增加一列頻率,計算頻率。即頻率=■,本例中,只需計算第一組的頻率,下拉即可得這列頻率數據值。修改后頻率分布表見表3
(七)完成頻率分布直方圖
將表(2)頻數列替換成表(3)頻率列,點擊右鍵數據標志格式,得到頻率分布直方圖(見圖2)。
此種繪制方法可以用在工程上,可以作進一步修改,使之符合我們使用要求。
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2014 . 16. 083
[中圖分類號] G64 [文獻標識碼] A [文章編號] 1673 - 0194(2014)16- 0140- 06
教學管理中,經常要對大量的數據進行分析、匯總,由此也產生了大量的管理軟件,但是,軟件再多,畢竟無法解決層出不窮的新問題。因此,管理人員掌握常用的數據庫軟件的使用,可以及時、較好地解決實際工作中的各種問題,提升工作效率。在眾多的數據庫軟件中,Excel作為普及度最高的軟件,擁有著強大的數據管理分析功能,而且隨著軟件的升級,加入了更多、更強大的功能,掌握好Excel的使用、充分運用其功能,將成為解決實際問題的“利刃”。本文以多次考試成績的匯總、分析為例,提出應用Excel解決類似問題的思路,并詳細講解實際操作方法。還要指出,本問題的解決,還可應用于公司銷售業績、進出貨物管理等多種情形,因此具有相當的普適性。
1 提出問題
大量來自不同地區的人員參加考試,每次組織綜合科目和不同的專業科目考試,同時通過綜合科目和某一專業科目才能取得該專業執業證書,沒通過相關科目的人員可能再參加后面批次的考試,要求匯總分析每一次考試和幾次考試的人員通過情況和地區通過情況,整理出幾次考試后可取得執業注冊證書的人員名單,分析每一考試科目的總體通過情況。
2 思路分析
解決該問題的難點在于整理執業證書人員名單時,必須通過綜合和專業考試科目,而這兩個科目不一定是在一次考試通過,而且考試的專業比較多。
在分析問題時,也應當看到,結果并不要求對每次考試的具體成績進行層次分析,這樣即可簡化我們解題思路,即將通過、不通過定義為1、0即可,而不需要分析具體的考試分數(當然也可通過其他辦法來進行考試成績的定量分析)。
基于以上兩個主要方面的分析,我們可以得出,利用Excel的數據透視表來解決這一問題是一個比較適當的方法。因為數據透視表是用來從Excel數據列表、關系數據庫文件或OLAP多維數據集等數據源的特定字段中總比信息的分析工具。它是一種交互性報表,可以快速分類匯總比較大量的數據,并可以隨時選擇其中頁、行和列中的不同元素,以達到快速查看數據源的不同統計結果,同時還可以隨意顯示和打印出用戶感興趣的區域和明細數據。數據透視表有機地綜合了數據排序、篩選和分類匯總等數據分析方法的優點,可以方便地調整分類匯總的方式,靈活地以多種不同方式展示數據的特征。
3 實際操作
在本節中,以分析解決問題為主線,穿插了Excel數據處理中的常用方法。考慮到Excel 2010在數據透視表方面顯著的功能升級和強化,本文以Excel 2010版本為平臺進行操作。
3.1 整理數據源
在食品研究中,通徑分析有利于在一個變量系統中更為深入清晰的分析變量間的相互關系,從而抓住關鍵因素,改進生產工藝,降低生產成本、提高產品質量及提高生產效率等提供信息依據。本文以常見的Excel軟件對通徑分析方法進行講解,分析數據來自文獻,具體為 在某品牌桃肉果汁加工過程中非酶褐變原因的研究中,測定了該飲料中的無色花青苷(x1)、花青苷(x2)、美拉德反應(x3)、抗壞血酸含量(x4)和非酶褐變色度值(y),結果見表1。
表1 桃肉果汁加工過程中非酶褐變原因研究測定值
一、數據錄入
打開Excel工作表,建立表頭,在單元格A1:F1內按順序分別輸入“測定序號”、“無色花青苷(x1)”、“花青苷(x2)”、“美拉德反應(x3)”、“抗壞血酸含量(x4)” 和“非酶褐變色度值(y)”,然后在A2:A17區域按順序輸入個體編號,在B2:F17輸入各個變量的原始數據。
二、相關系數的計算
首先計算變量之間的簡單相關系數。單擊菜單欄的“工具”“數據分析”“相關系數”,彈出相關系數對話框,指定輸入區域B2:F17,分組方式選逐列,輸出區域開始的單元格指定為A20,單擊“確定”,計算出變量之間簡單相關系數,結果見表2。
表2 變量之間的簡單相關系數
三、因變量對自變量的多元回歸分析
建立X1、X2、X3、X4對Y的多元回歸方程的方法是:單擊“工具”“數據分析”“回歸”,彈出回歸分析對話框。指定Y值輸入區域為F2:F17,X值輸入區域為B2:E17,Y值和X值的輸入區域必須由按列輸入的數據組成。輸出區域開始的單元格指定為A30,單擊“確定”,如表3。
表3 回歸統計輸出結果
表4 方差分析輸出結果
表5 多元回歸分析的輸出結果
由表4中的方差分析結果可知,F=26.3690(P=0.0001),有統計學意義,說明建立Y關于X1、X2、X3、X4的多元回歸方程是有意義的,進行通徑分析也是有意義的。多元回歸方程的各個偏回歸系數分別為b1= - 69.6264 有統計學意義;b2 = 189.5118 有統計學意義;
b3= -53.6917 無統計學意義;b4= 1.3729 有統計學意義。
四、通徑系數的計算
通徑系數的計算公式為, bi為偏回歸系數,Sxi為Xi的標準差、Sy為Y的標準差。計算變量標準差的方法:在單元格B57內輸入公式“=STDEV(B2:B17)”,計算出無色花青苷X1的標準差,然后將B57的公式橫向復制到C57 ~ F57,Excel 表格將自動計算出X2、X3、X4和Y的標準差,并計算出其通徑系數(見表6)。
表6 各變量的標準差及通徑系數
對通徑系數的顯著性測驗與多元回歸分析中對偏回歸系數的顯著性測驗是等價的,故P1y = -0.5073 有統計學意義;P2y = 0.7618 有統計學意義; P3y =-0.1826 無統計學意義;P4y =0.3697 有統計學意義。回歸方程的誤差e對y也產生作用,其大小以剩余通徑系數Pye表示。Pye的計算公式為:
5. 間接通徑系數的計算
圖1 通徑圖
通徑系數是自變數對因變數直接作用的度量,通徑系數又叫直接通徑系數。如果一個自變數與其他自變數之間存在相關關系,則該自變數還可以通過其他自變數對因變數發生間接作用,其一自變量通過另一自變量間接作用于因變量的間接通徑系數等于二者相關系數乘以另一自變量的直接通徑系數。制作通徑圖并進行原因對結果直接作用與間接作用分析,結果見圖1。將無色花青苷X1、花青苷X2、美拉德反應X3和抗壞血酸含量X4與非酶褐變色度值Y的相關系數剖分為直接作用與間接作用的代數和,結果見表7。
表7 相關系數的分解
通徑分析的理論已證明,任一自變數與因變數之間的簡單相關系數,可以分解為該自變數與因變數之間的直接通徑系數加上所有其他間接通徑系數加上所有其他間接通徑系數的代數和。花青苷X2對非酶褐變色度的相對決定程度最大, 而美拉德反應對非酶褐變色度的影響不大,可以不必過多考慮。
小結
1. 由表6可知,3個原因變量對非酶褐變色度值的作用由大到小依次為花青苷>無色花青苷>抗壞血酸含量。花苷青與非酶褐變色度的相關系數和通徑系數都有統計學意義,說明花苷青對非酶褐變色度的影響主要來自于自身的直接作用。
2. 本例中的剩余通徑系數Pye=0.7472,其值較大,說明還有一些對對非酶褐變色度影響較大的因素沒有被考慮。本文只是以這個例子說明在Excel內進行通徑分析的簡便方法,對非酶褐變色度影響因素的全面分析有待進一步深入。
3. 目前,對影響因素的分析人們常采用的方法是多元回歸分析,但多元回歸分析只考察變量之間的直接作用,而實際上變量之間的關聯關系往往是一個復雜的傳遞過程。通徑分析將簡單相關系數分解為直接通徑系數和間接通徑系數,使人們能夠透過相關的表面現象深入研究原因變量與結果變量之間的因果關系,從而為統計決策提供可靠的依據。
中圖分類號:TP31 文獻標識碼:A
Excel是微軟公司開發的辦公軟件系列中的一款數據處理軟件,它不僅可以用于輸入和操縱數據,同時也為我們提供了許多數據管理與分析工具,有時我們在進行計算時常常需要假設某種情況,比如改變其中的一個條件,結果也要發生相應變化,同時我們又想對比這些情況,這時我們就可以使用excel提供的數據管理與分析工具,幫助我們模擬運行的可能結果,①如模擬運算表,方案管理器等。
下面我們就以購買商品房辦理銀行按揭為背景,利用“模擬運算表”和“方案管理器”來分別計算貸款額度、貸款年限及月利率分別改變時對月還款額的影響,為用戶選擇一種適合自己的貸款方案提供參考。
第一步:建立購房貸款計劃表如圖1所示,將所有月還款額對應的單元格設置為數值類型。
圖1
第二步:利用PMT函數計算固定貸款額度,貸款年限,月利率下月還款額。
在E8單元格中輸入公式:=PMT(C8,B8*12,A8),這里利用PMT函數來計算月還款額,PMT(rate,nper,pv,fv,type)是基于固定利率及等額分期付款方式下返回貸款的每期付款額。其中Rate代表貸款利率,Nper代表該項貸款的付款總次數,rate與nper要相匹配,譬如果rate為月利率,那么nper應為月數,Pv代表本金,Fv代表在最后一次付款后希望得到的現金余額,忽略表示0,Type值為0或省略表示付款時間是在期末,為1時表示在期初。
第三步:利用單變量模擬運算表計算固定貸款額度,貸款年限,不同月利率下月還款額的變化。
在B10單元格輸入PMT公式計算月還款額,選擇B9:F10區域,點擊數據菜單下的模擬運算表,在輸入引用行單元格輸入$C$8,點擊確定。使用單變量模擬運算表時有幾個需要注意的地方。
(1)單元格公式位置:模擬表區域中可變條件在同一行,那么單元格公式在模擬表的左下方(如果可變條件在同一列,那么單元格公式在模擬表的右上方);
(2)輸入引用行(列)單元格選擇:模擬表區域中可變條件在同一行,那么選擇輸入引用行單元格(如果可變條件在同一列,那么選擇輸入引用列單元格);
(3)輸入引用行(列)單元格中數據:根據模擬表區域中可變條件,在輸入引用行(列)輸入單元格公式中用到的對應的條件單元格。
第四步:利用雙變量模擬運算表計算固定貸款額度,不同貸款年限,不同月利率下月還款額的變化情況
首先在A14單元格中輸入公式=PMT(C8,B8*12,A8),計算某一固定貸款額度,貸款年限及貸款利率下月還款額,然后選中A14到F18這片連續的單元格,點擊數據菜單下的模擬運算表,在輸入引用行的單元格中填寫$B$8,在輸入引用列的單元格中輸入$C$8,點擊確定。使用雙變量模擬運算表時有幾個需要注意的地方。
(1)單元格公式位置:模擬表區域中左上角頂角的位置;
(2)輸入引用行單元格中數據:根據單元格區域中第一行中的可變條件,在輸入引用行的單元格中輸入單元格公式中用到的對應的條件單元格;
(3)輸入引用列單元格中數據:根據單元格區域中第一列中的可變條件,在輸入引用列的單元格中輸入單元格公式中用到的對應的條件單元格。
第五步:當貸款額度,貸款年限,月利率都發生改變的情況下可以使用方案管理器進行比較,方案是excel保存在工作表中并可以自動替換的一組值,使用方案管理器可以預測工作表模型的輸出結果,在工作表中創建并保存了不同的數值組,通過切換到任意的新方案可以查看不同的結果。