R

試處理R常見的non-zero exit status問題

肥貓 發表於 三, 09/14/2022 - 06:15

前言

三年前在修讀多變量統計課程的時候,剛好也是我往Ubuntu遷移的第一年,首要的挑戰也就是在Ubuntu上建立R的作業環境。當時其中一個最困擾我的問題,是安裝特定套件時,老是出現non-zero exit status的錯誤訊息,然後那個套件不能用,我就愣在那裡不知如何是好,情急時只好拿鄰近的Windows電腦,重建一個臨時的R環境救火。這樣對於平台轉移計畫來說當然不是好事,若因此貽誤作業或工作更是一場災難。

直到論文寫完服役前,我才有餘裕稍微靜下心來研究這問題該怎麼辦,當時剛好在學習用R做地形圖的時候,透過爬文和實作稍微學到解決方法,但當下還沒想到要寫下來。退役後我在學習使用Debian,重建R環境的時候剛好又遇到同樣的問題,用了一年前的方法排障,經驗大致上成功。於是我就把它寫下來存參:

探討成因:

我還沒有力氣搞清楚所謂的non-zero exit status到底是怎麼回事,從非技術人的角度,似乎只知道就是某個套件無法安裝,害我不能工作。不過在這裡也沒那麼重要。

用R做簡單(但實用)的資料整併

肥貓 發表於 三, 08/04/2021 - 16:50

近期需要從較老舊的圖書館系統匯出想借閱的書目列表,資料結構大概長這樣:

原書目資料結構________________________________________

裝訂及其他區別字樣:平裝 

發行性質/價格:新臺幣780元 

一般性資料:20160111d2015 k y0chiy09 e 

正文語文:chi 

......

_________________________________________

但是上面那樣顯然不是適合人閱讀的報表,也不利後續利用。因此需要整理成如下圖的樣式:

用R處理字串的簡單示範

肥貓 發表於 周日, 07/04/2021 - 15:13

因為我喜歡將從開放式課程網頁下載得到的影片檔轉換成音檔,存入手機等方便隨身攜帶與收聽,便衍生出使用命令列(本例為ffmpeg)批次處理的需求。一種方法是用WinFF來代勞,但是若有客製化需求的時候,直接打命令列還是比較乾脆。但是我當然不想傻傻地一個一個檔案慢慢key,便需要利用R的字串處理工具,把變數(如檔案路徑與名稱)和命令式整合在一起。以下示範相關過程與程式碼。

  • 前處理:設定變數與欄位

第一步是先設定變數與欄位,所以我先在Calc做了兩欄,一欄是來源檔的檔名和路徑(在Ubuntu,你可以透過複製該檔,在Calc直接以純文字貼上該檔案路徑);另一欄則是你想要的格式,如果你想做得細一點,也可以再新增一欄鍵入各種參數。

標籤 (Tags)

R語言用於基礎敘述統計的示範

肥貓 發表於 週六, 05/08/2021 - 16:22

最近因為支援會議所需,被委託處理與會者的資料。雖然都是敘述統計,但是現有的商業軟體難以滿足兼顧效率與經濟的需求。

  1. Excel製作次數分配表(Frequency)的步驟很繁瑣,我看過有人用樞紐分析表做,但看了眼花撩亂。

  2. 即使製成表之後,Excel用滑鼠點放製作圓餅圖、直條圖的方式也非常繁瑣,實在難以勝任同時要處理數十張圖的任務。

標籤 (Tags)