ubuntu 近半年來隨機的開機凍結的元兇? [論壇 - Ubuntu基本設定]


正在瀏覽:   2 名遊客


 到底部   前一個主題   下一個主題  [無發表權] 請登錄或者註冊

(1) 2 »


ubuntu 近半年來隨機的開機凍結的元兇?
會員二級
註冊日期:
2011/7/9 13:27
所屬群組:
已註冊使用者
等級: 8
HP : 0 / 193
MP : 31 / 4542
EXP: 73
離線
18.10用了一兩個月以後,隨著某次的套件更新,開始出現了隨機的開機凍結…

發生的頻率很高,差不多三四次開機就會發生一次,

症狀是 凍結在ubuntu lodo畫面,
鍵盤滑鼠無反應,
沒辦法用CTRL+ALT+Fn叫出終端機,
CTRL+ALT+DEL無法重新開機,
只能按下RESET按鍵… Orz

一開始以為是硬體問題,但是隨著其他機器也開始出現這個問題,加上交叉檢測硬體後,可以初步排除是硬體的問題…

**edit**

原本以為是套件zram的問題,後來發現是ubuntu kernel + intel-microcode的問題

相關資料及workaround請看後面的討論…


***

5/29 10:40:47
應用擴展 工具箱
回覆: [zram] 近半年來隨機的開機凍結的元兇…Orz
會員二級
註冊日期:
2017/3/23 10:15
所屬群組:
已註冊使用者
等級: 6
HP : 0 / 143
MP : 20 / 981
EXP: 75
離線
如果是 Intel 內建顯示的話
我深入追蹤之後發現 應該是 GL(MESA) PipelinePrograms 的問題

MESA_SHADER_VERTEX
MESA_SHADER_TESS_CTRL
MESA_SHADER_TESS_EVAL
MESA_SHADER_GEOMETRY

可能 GT2/3 讀取到 GT1 的設定,或是 GT1 讀取到 GT2/3 的設定

總之可能是裝置ID 讀取錯誤 導致錯誤的設定

這些跟圖形有關 會凍結的應該是這個。也有可能是核心裡面的模塊導致的


應該測試換舊版 MESA 看看 還會不會凍結,但是我知道你們一定不會換

5/30 11:29:25
應用擴展 工具箱
回覆: [zram] 近半年來隨機的開機凍結的元兇…Orz
會員二級
註冊日期:
2011/7/9 13:27
所屬群組:
已註冊使用者
等級: 8
HP : 0 / 193
MP : 31 / 4542
EXP: 73
離線
呆丸廖添丁 寫到:
如果是 Intel 內建顯示的話
我深入追蹤之後發現 應該是 GL(MESA) PipelinePrograms 的問題
MESA_SHADER_VERTEX
MESA_SHADER_TESS_CTRL
MESA_SHADER_TESS_EVAL
MESA_SHADER_GEOMETRY
可能 GT2/3 讀取到 GT1 的設定,或是 GT1 讀取到 GT2/3 的設定
總之可能是裝置ID 讀取錯誤 導致錯誤的設定
這些跟圖形有關 會凍結的應該是這個。也有可能是核心裡面的模塊導致的
應該測試換舊版 MESA 看看 還會不會凍結,但是我知道你們一定不會換


如果是MESA方面的問題,

那…為什麼移除ZRAM以後就不會凍結了呢?

這個「鍋」是該ZRAM來揹還是MESA來揹呢?

:)

5/30 14:28:25
應用擴展 工具箱
回覆: [zram] 近半年來隨機的開機凍結的元兇…Orz
會員二級
註冊日期:
2017/3/23 10:15
所屬群組:
已註冊使用者
等級: 6
HP : 0 / 143
MP : 20 / 981
EXP: 75
離線
MMX 寫到:
呆丸廖添丁 寫到:
如果是 Intel 內建顯示的話
我深入追蹤之後發現 應該是 GL(MESA) PipelinePrograms 的問題
MESA_SHADER_VERTEX
MESA_SHADER_TESS_CTRL
MESA_SHADER_TESS_EVAL
MESA_SHADER_GEOMETRY
可能 GT2/3 讀取到 GT1 的設定,或是 GT1 讀取到 GT2/3 的設定
總之可能是裝置ID 讀取錯誤 導致錯誤的設定
這些跟圖形有關 會凍結的應該是這個。也有可能是核心裡面的模塊導致的
應該測試換舊版 MESA 看看 還會不會凍結,但是我知道你們一定不會換


如果是MESA方面的問題,

那…為什麼移除ZRAM以後就不會凍結了呢?

這個「鍋」是該ZRAM來揹還是MESA來揹呢?

:)


不曉得耶 GPU 的暫存資料都是放在記憶體映射空間 不像 CPU 有暫存器可以暫放
那可能就是 ZRAM 導致的

5/30 21:20:12
應用擴展 工具箱
回覆: [zram] 近半年來隨機的開機凍結的元兇…Orz
會員五級
註冊日期:
2009/10/29 4:50
所屬群組:
已註冊使用者
等級: 41
HP : 201 / 1005
MP : 889 / 28587
EXP: 21
離線
呆丸廖添丁 寫到:
如果是 Intel 內建顯示的話
我深入追蹤之後發現 應該是 GL(MESA) PipelinePrograms 的問題

MESA_SHADER_VERTEX
MESA_SHADER_TESS_CTRL
MESA_SHADER_TESS_EVAL
MESA_SHADER_GEOMETRY

可能 GT2/3 讀取到 GT1 的設定,或是 GT1 讀取到 GT2/3 的設定

總之可能是裝置ID 讀取錯誤 導致錯誤的設定

這些跟圖形有關 會凍結的應該是這個。也有可能是核心裡面的模塊導致的


應該測試換舊版 MESA 看看 還會不會凍結,但是我知道你們一定不會換


就是這個問題嗎? https://www.ubuntu-tw.org/modules/newbb/viewtopic.php?topic_id=108090

5/30 23:55:38
應用擴展 工具箱
回覆: [zram] 近半年來隨機的開機凍結的元兇…Orz
會員二級
註冊日期:
2011/7/9 13:27
所屬群組:
已註冊使用者
等級: 8
HP : 0 / 193
MP : 31 / 4542
EXP: 73
離線
看來可能跟intel 的microcodec或是 ACPI有關…


https://askubuntu.com/questions/1144800/ubuntu-18-04-2-boot-stuck-on-purple-screen-after-updates

https://bugs.launchpad.net/ubuntu/+source/linux/+bug/1829620

https://bugs.launchpad.net/ubuntu/+source/linux-signed-hwe/+bug/1829784

不過,之前intel ME事件時曾經跟石頭店詢問過,得到的回答是制式的「該產品並不支援linux唷~(就差沒加上個糾咪了…)」

看來這BUG有得慢慢修了…

5/31 1:10:00
應用擴展 工具箱
回覆: [zram] 近半年來隨機的開機凍結的元兇…Orz
會員二級
註冊日期:
2017/3/23 10:15
所屬群組:
已註冊使用者
等級: 6
HP : 0 / 143
MP : 20 / 981
EXP: 75
離線
Xenomorph0525 寫到:

就是這個問題嗎? https://www.ubuntu-tw.org/modules/newbb/viewtopic.php?topic_id=108090


要交叉測試 你可以換個舊的套件庫 回滾看看 不行的話就重新編譯舊版看看

那個是圖形加速驅動 繪圖的函數 會凍結就是讀取到的數值不正確 跟你的GPU不符

那你就看核心紀錄是不是有顯示 GPU Hang 什麼 ring 之類的訊息
如果有 那就是了...

從最基本的 Intel DRM 驅動 讀取裝置ID部份 如果那裡有問題 也會導致 MESA 繪圖的函數出問題 DRM 是綁在核心的

在Linux底下 可能是 DRM 驅動 也可能是 MESA 所導致的

5/31 20:18:50
應用擴展 工具箱
回覆: [zram] 近半年來隨機的開機凍結的元兇…Orz
會員五級
註冊日期:
2009/10/29 4:50
所屬群組:
已註冊使用者
等級: 41
HP : 201 / 1005
MP : 889 / 28587
EXP: 21
離線
呆丸廖添丁 寫到:
Xenomorph0525 寫到:

就是這個問題嗎? https://www.ubuntu-tw.org/modules/newbb/viewtopic.php?topic_id=108090


要交叉測試 你可以換個舊的套件庫 回滾看看 不行的話就重新編譯舊版看看

那個是圖形加速驅動 繪圖的函數 會凍結就是讀取到的數值不正確 跟你的GPU不符

那你就看核心紀錄是不是有顯示 GPU Hang 什麼 ring 之類的訊息
如果有 那就是了...

從最基本的 Intel DRM 驅動 讀取裝置ID部份 如果那裡有問題 也會導致 MESA 繪圖的函數出問題 DRM 是綁在核心的

在Linux底下 可能是 DRM 驅動 也可能是 MESA 所導致的


感謝回答,
我頂多試裝舊套件吧?實在不想搞自行編譯這種大工程……

光是捉錯聽起來就很麻煩,
每個開發者都辛苦了,希望Linux越來越好。

5/31 21:35:11
應用擴展 工具箱
回覆: ubuntu 近半年來隨機的開機凍結的元兇…Orz
會員二級
註冊日期:
2011/7/9 13:27
所屬群組:
已註冊使用者
等級: 8
HP : 0 / 193
MP : 31 / 4542
EXP: 73
離線
後續回報

兩台 ubuntu桌機移除zram以後,各累計了50次以上成功開機,結果昨晚跟今天各出現一次開機凍結了…(看來高興得太早了… Orz )

參考 bugs.launchpad.net/ubuntu/+source/linux/+bug/1829620 以及其延伸出的相關討論,先在grub啟動選項加上了dis_ucode_ldr,目前各重開了十幾次都正常,繼續觀察一段時間…

6/1 14:40:36
應用擴展 工具箱
回覆: ubuntu 近半年來隨機的開機凍結的元兇?
會員二級
註冊日期:
2009/5/16 1:44
所屬群組:
已註冊使用者
等級: 7
HP : 0 / 160
MP : 24 / 4766
EXP: 40
離線
原來不只我有此情況
我原本也以為是硬體有問題

但我並不是使用Intel內顯,我的主機板內顯是Integrated ATI Radeon HD 3000 GPU

6/2 10:07:05
應用擴展 工具箱

(1) 2 »

 [無發表權] 請登錄或者註冊


可以查看帖子.
不可發帖.
不可回覆.
不可編輯自己的帖子.
不可刪除自己的帖子.
不可發起投票調查.
不可在投票調查中投票.
不可上傳附件.
不可不經審核直接發帖.