
在全基因體關聯性研究(Genome-Wide Association Study, GWAS)的分析中
干擾因子(confounder)的控制是重要的課題,其中最重要的干擾因子為族群分層(population stratification)
性狀(trait)或疾病的分布在不同族群中會不一樣,SNP的頻率在不同族群的分布也會不一樣
因此在探討兩者的關係時,若沒有考慮到族群分層,可能會出現偽陽性或偽陰性的結果
即使分析的研究對象都是來自單一族群,仍可能存在次分群的狀況
所以在完成QC後,進行相關性檢定前,需對研究族群進行主成分分析(Principle Component Analysis, PCA)
隨後將PCA結果作為共變數(covariate),加入迴歸模型中以控制族群分層的影響
rover1023 發表在 痞客邦 留言(0) 人氣(2,682)

在進行全基因體關聯性研究(Genome-Wide Association Study, GWAS)分析時
quality control的其中一個步驟是排除具有近親關係的個案,以避免研究結果產生偏差
高密度的全基因體定型資料(whole-genome genotype data)提供了機會能夠評估個案間的親綠關係
進而達成這個目的,其概念簡單來說:
觀察兩位個案在所有SNPs的相似程度來判斷兩人的親緣關係遠近,即計算IBD (Identity-by-Decent)
IBD是介於0到1之間的數值,數值越高代表兩人的親緣關係越親近;越低代表兩人越無關
在實務上,SNPs間因聯鎖不平衡(Linkage Disequilibrium, LD)的關係,彼此有著高度的相關
並不用比較所有的SNPs,只需十萬個左右的SNPs就可以得到穩定的估計值
因此親緣關係的判斷可以分為兩個步驟:1、篩選用來估計IBD的SNPs;2、估計親緣係數
rover1023 發表在 痞客邦 留言(0) 人氣(2,729)

出遊日:2018/10/18 (四)
下午四點多,在安頓好飯店與行李後,就可以開始探訪這迷人又富有歷史的千年古都
第一站來到位在Super Hotel 烏丸五条店步行不到3分鐘距離遠的
東本願寺(Higashi Honganji Temple)東本願寺的正式名稱是「真宗本廟」,興建於1602年,為日本淨土真宗大谷派的本山
在江戶時期寺院曾數度遭遇火災,所以目前所見的主體建築是明治時期耗時16年光陰才重建完成
開放時間:05:50-17:30 (11月-2月 06:20-16:30),門票:免費
rover1023 發表在 痞客邦 留言(0) 人氣(501)

入住時間:2018/10/18 (四) ~ 2018/10/24 (三)
超級酒店(Super Hotel, スーパーホテル)是廣泛分布於全日本的連鎖商務旅館,共有133家分店
甚至連海外的越南與緬甸也都有Super Hotel的蹤跡
在京都有兩間分店,這次入住的是烏丸五条店(Karasuma Gojo)
雖然距離京都車站步行約需10-15分鐘,但地下鉄五条駅的8號出口就在飯店旁
所以一出地下鐵就可以看到飯店了,超近~超方便的~~
rover1023 發表在 痞客邦 留言(0) 人氣(514)

出遊日:2018/10/18 (四)
凌晨五點搭上從市府轉運站前往桃園機場的大有巴士,展開這段探險之旅
約莫六點左右抵達EVA Air所在的Terminal 2
也許臺灣人出國的經驗越來越豐富,使用自助報到機(Kiosk)已經很熟悉
以致於使用自助報到機居然也要排隊,只是不用像航空公司報到櫃檯排隊等那麼久
若不知道怎麼使用或中間卡住時,旁邊都有各航空公司的地勤人員可以詢問
若有行李需要託運,報到完畢拿到登機證與行李條後,再至自助報到的行李託運(Baggage Drop)櫃檯辦理
這樣前前後後不用20分鐘的時間就完成了,還有多餘的時間可以悠閒的換外幣或是領取Wi-Fi分享器
rover1023 發表在 痞客邦 留言(0) 人氣(1,731)

每天中午在買飯的路上,總是可以看見從松山機場起飛的飛機在藍天白雲中畫出的美麗弧線
期待著哪天自己也會是那架飛機上的一員,開啟一段美麗的旅程
今年一位碩班同學在因緣際會下被挖角到日本京都大學當研究人員
這讓我有機會能實現多年來一直想嘗試的一個人出國旅行
再套上同學的話:「歡迎大家來京都拍打,不用餵食沒關係,順便關懷邊緣人~~」
因此,在敲定好時間後,第一次一個人出國的京都自由行即將出發!!
rover1023 發表在 痞客邦 留言(0) 人氣(2,253)

基本上,在執行macro程序時,需要一一宣告巨集變數
如:想針對問卷中的性別及年齡變項進行單變項的邏輯斯迴歸
可以先建立一段執行邏輯斯迴歸分析的macro程序,假設命名為logistic
接著以「
%logistic(SEX);」和「
%logistic(AGE);」來宣告要執行的變項名稱
但當要分析的變項很多時,key這些巨集變數就變得是件很麻煩的事,且還可能不小心key錯
不過,若已經有一份欲分析的變項清單時,整件事就會變得很簡單了~~
rover1023 發表在 痞客邦 留言(0) 人氣(1,833)

延續上一篇文章的狀況,但改利用門診檔計算:
若要計算1996-2001年門診檔中每人最早的糖尿病門診日期及糖尿病總門診次數
並只保留門診次數大於等於2者,且需排除就診科別為牙科及中醫科的資料
macro程式會是:
rover1023 發表在 痞客邦 留言(0) 人氣(1,860)

在資料整理或分析的過程中,有時候需要反覆執行某一段程序
每次執行的程序可能只有欄位不同或檔案不同,其餘大部分的程式是一樣的
最簡單也是最笨的方法就是一直Ctrl+C and Ctrl+V,然後再修改每段程序裡的欄位名稱或檔案名稱
但很沒效率,程式也變得像阿媽的裏腳布那樣又臭又長,很不美觀
此時,SAS的巨集函數(macro)就會是我們的最好朋友
macro能用較簡短的程式來完成相同的工作,不僅讓整個程式看起來更簡潔,也提升工作效率
其基本架構是以「%macro」開頭,中間包覆著一段要重複執行的程序,最後以「%mend」結束,如:
%macro name(variable1, variable2);
/*重複執行的程序*/
%mend;
其中,name是宣告此段巨集函數的名稱
variable1, variable2是一直要被取代的巨集變數,會在被包覆的程序裡,加上「&」符號來宣告
到這邊是在宣告希望macro幫我們執行哪些反覆的程序,但實際要執行時需再呼叫此macro出來,即:
%name(variable1, variable2);
rover1023 發表在 痞客邦 留言(0) 人氣(17,045)

出遊日:2016/4/3 (日)
不知不覺,已經來到在新加坡的最後一天了 OH~~不!!
在離開前,還有上午的時間可以到位於中央商業區的
聖安德烈教堂(St. Andrew's Cathedral)晃晃
最初的聖安德烈教堂興建於1835年,但兩次雷擊造成的損害被迫在1852年關閉、1855年拆除
因此,目前所見的教堂建於1856年,是一座早期英國哥德式建築,也是新加坡最大的天主教教堂
在1973年被列為新加坡國家級歷史古蹟保存
其外牆是由石灰、貝殼、糖、蛋白、水、椰子殼混合而成的特殊材料來舖砌
讓教堂雖經歷了上百年歲月的洗禮,但外表仍推持著醒目的純白外觀
站在這高雅、宏偉的教堂前,仰望著高聳的塔尖,感受著莊嚴又寧靜安詳的氛圍
rover1023 發表在 痞客邦 留言(0) 人氣(733)