Hướng dẫn kiểm tra nhiệt độ CPU server trên Linux

Khi mình quản trị máy chủ Linux, có đôi lúc gặp phải những log lỗi cảnh báo về nhiệt độ CPU đang phải chịu đựng khá là cao đấy dẫn đến treo hệ thống. Đến lúc cần kiểm tra thì nó qua cơn và cũng không biết làm sao để kiểm tra được nhiệt độ CPU trên Linux như thế nào đây ?! May thay ở bài viết này mình sẽ hướng dẫn các bạn cài đặt “lm_sensors”  để kiểm tra nhiệt độ CPU trên Linux nhé. Cùng đọc bài viết tại Cuongquach.com nào.

Có thể bạn quan tâm chủ đề khác:
Top 6 cách xác định loại filesystem trên Linux
Hướng dẫn sử dụng lệnh SS trên Linux
Ebook Troubleshooting CentOS PDF
Ebook Linux All-in-one for Dummies 5th

Thao tác kiểm tra nhiệt độ CPU trên Linux

1. Cài đặt lm_sensors

Thông thường chương trình “lm_sensors” không được cài đặt mặc định trên các OS. Bạn cần cài đặt thêm chương trình này vào Linux. Nếu repo mặc định không có thì hãy cài đặt repo ngoài như EPEL trên CentOS.

+ RHEL/CentOS/Fedora

# yum install lm_sensors

+ Debian/Ubuntu

# sudo apt-get install lm-sensors

2. Cấu hình lm_sensors

Sau khi cài đặt lm_sensors hoàn tất, thì bạn cần chạy lệnh dưới để thực hiện cấu hình lm_sensors.

# sensors-detect

Tại sao phải chạy lệnh “sensors-detect” ? sensors-detect là một chương trình độc lập dùng để kiểm tra các thành phần phần cứng đang có trên server và lựa chọn các module phù hợp để load nhằm tương tác được với chúng.

Bạn chỉ cần lựa chọn “yes” cho các nội dung kiểm tra, đa phần hoạt động scan đều rất an toàn và không gây ra bất cứ vấn đề gì. Sau khi chương trình chạy xong thì sẽ tự tạo ra file cấu hình “/etc/conf.d/lm_sensors” được sử dụng bởi dịch vụ lm_sensors.service nhằm load kernel module cần thiết khi boot.

Output lệnh trên khi chạy trên máy tính/máy chủ Linux vật lý của mình sẽ có output như sau :

# sensors-detect

# sensors-detect revision 3.4.0-4 (2016-06-01)
# System: HP ProLiant BL460c Gen9
# Kernel: 3.10.0-327.el7.x86_64 x86_64
# Processor: Intel(R) Xeon(R) CPU E5-2620 v4 @ 2.10GHz (6/79/1)

This program will help you determine which kernel modules you need
to load to use lm_sensors most effectively. It is generally safe
and recommended to accept the default answers to all questions,
unless you know what you're doing.

Some south bridges, CPUs or memory controllers contain embedded sensors.
Do you want to scan for them? This is totally safe. (YES/no): yes
Silicon Integrated Systems SIS5595... No
VIA VT82C686 Integrated Sensors... No
VIA VT8231 Integrated Sensors... No
AMD K8 thermal sensors... No
AMD Family 10h thermal sensors... No
AMD Family 11h thermal sensors... No
AMD Family 12h and 14h thermal sensors... No
AMD Family 15h thermal sensors... No
AMD Family 16h thermal sensors... No
AMD Family 15h power sensors... No
AMD Family 16h power sensors... No
Intel digital thermal sensor... Success!
(driver `coretemp')
Intel AMB FB-DIMM thermal sensor... No
Intel 5500/5520/X58 thermal sensor... No
VIA C7 thermal sensor... No
VIA Nano thermal sensor... No

...
...
...
...

Next adapter: mga i2c (i2c-1)
Do you want to scan it? (yes/NO/selectively): yes



Now follows a summary of the probes I have just done.
Just press ENTER to continue: yes

Driver `to-be-written':
* ISA bus, address 0xca2
Chip `IPMI BMC KCS' (confidence: 8)

Driver `coretemp':
* Chip `Intel digital thermal sensor' (confidence: 9)

Note: there is no driver for IPMI BMC KCS yet.
Check http://www.lm-sensors.org/wiki/Devices for updates.

Unloading i2c-dev... OK

3. Xem thông tin nhiệt độ CPU trên Linux

Giờ tới phần chúng ta mong muốn nhất đó chính là kiểm tra nhiệt độ của CPU trên máy tính/máy chủ đang phải “chịu đựng“.

# sensors
power_meter-acpi-0
Adapter: ACPI interface
power1: 0.00 W (interval = 300.00 s)

coretemp-isa-0000
Adapter: ISA adapter
Physical id 0: +40.0°C (high = +80.0°C, crit = +90.0°C)
Core 0: +34.0°C (high = +80.0°C, crit = +90.0°C)
Core 1: +35.0°C (high = +80.0°C, crit = +90.0°C)
Core 2: +34.0°C (high = +80.0°C, crit = +90.0°C)
Core 3: +33.0°C (high = +80.0°C, crit = +90.0°C)
Core 4: +33.0°C (high = +80.0°C, crit = +90.0°C)
Core 5: +34.0°C (high = +80.0°C, crit = +90.0°C)
Core 6: +34.0°C (high = +80.0°C, crit = +90.0°C)
Core 7: +33.0°C (high = +80.0°C, crit = +90.0°C)

coretemp-isa-0001
Adapter: ISA adapter
Physical id 1: +35.0°C (high = +80.0°C, crit = +90.0°C)
Core 0: +29.0°C (high = +80.0°C, crit = +90.0°C)
Core 1: +29.0°C (high = +80.0°C, crit = +90.0°C)
Core 2: +28.0°C (high = +80.0°C, crit = +90.0°C)
Core 3: +29.0°C (high = +80.0°C, crit = +90.0°C)
Core 4: +29.0°C (high = +80.0°C, crit = +90.0°C)
Core 5: +29.0°C (high = +80.0°C, crit = +90.0°C)
Core 6: +30.0°C (high = +80.0°C, crit = +90.0°C)
Core 7: +28.0°C (high = +80.0°C, crit = +90.0°C)

Bạn có thể thấy với output lệnh như trên thì lệnh đã hiển thị thông tin nhiệt độ hiện tại của CPU, mức độ cao và cảnh báo nằm trong đóng ngoặc. Nếu bạn phát hiện nhiệt độ khá cao đối với CPU thì cần kiểm tra phần cứng ngay lập tức.

Nếu bạn muốn hiển thị nhiệt độ ở đơn vị độ F (Fahrenheit) thay vì đơn vị độ C (Celsius) thì sử dụng option ‘-f‘.

# sensors -f
power1: 0.00 W (interval = 300.00 s)

coretemp-isa-0000
Adapter: ISA adapter
Physical id 0: +102.2°F (high = +176.0°F, crit = +194.0°F)
Core 0: +93.2°F (high = +176.0°F, crit = +194.0°F)
Core 1: +95.0°F (high = +176.0°F, crit = +194.0°F)
Core 2: +91.4°F (high = +176.0°F, crit = +194.0°F)
Core 3: +91.4°F (high = +176.0°F, crit = +194.0°F)
Core 4: +91.4°F (high = +176.0°F, crit = +194.0°F)
Core 5: +93.2°F (high = +176.0°F, crit = +194.0°F)
Core 6: +91.4°F (high = +176.0°F, crit = +194.0°F)
Core 7: +91.4°F (high = +176.0°F, crit = +194.0°F)

coretemp-isa-0001
Adapter: ISA adapter
Physical id 1: +95.0°F (high = +176.0°F, crit = +194.0°F)
Core 0: +84.2°F (high = +176.0°F, crit = +194.0°F)
Core 1: +84.2°F (high = +176.0°F, crit = +194.0°F)
Core 2: +82.4°F (high = +176.0°F, crit = +194.0°F)
Core 3: +84.2°F (high = +176.0°F, crit = +194.0°F)
Core 4: +84.2°F (high = +176.0°F, crit = +194.0°F)
Core 5: +82.4°F (high = +176.0°F, crit = +194.0°F)
Core 6: +86.0°F (high = +176.0°F, crit = +194.0°F)
Core 7: +84.2°F (high = +176.0°F, crit = +194.0°F)

Mẹo để giám sát nhiệt độ CPU theo thời gian thực (realtime) trên terminal là kết hợp lệnh “watch“.

# watch -d5 -n1 'sensors'

Muốn coi thêm thông tin hướng dẫn sử dụng lệnh “sensors” .

# man sensors

Vậy là xong nội dung giúp bạn xem được thông tin về nhiệt độ CPU trên máy tính/máy chủ Linux rồi phải không nào. Chúc các bạn thành công. Nếu có khó khăn gì đừng ngại bình luận trao đổi cùng Cuongquach.com nhé.

 

Previous articleMagento vs Shopify: Đâu là nền tảng thương mại điện tử tốt nhất
Next article[AWS] Hướng dẫn tạo hoặc xoá AWS Account Alias
Bạn đang theo dõi website "https://cuongquach.com/" nơi lưu trữ những kiến thức tổng hợp và chia sẻ cá nhân về Quản Trị Hệ Thống Dịch Vụ & Mạng, được xây dựng lại dưới nền tảng kinh nghiệm của bản thân mình, Quách Chí Cường. Hy vọng bạn sẽ thích nơi này !