-

@ 필레몬
2025-05-25 00:41:24
[Bitaxe 감마 601 수리 과정]
근래 Bitaxe가 계속 Power Fault Detected 오류가 뜨며 해싱하지 않는 현상이 관찰되었다. 현재는 해결했는데, 좀 어이 없으니 결론이 필요한 분은 맨 마지막을 먼저 읽으시길 바란다. 내 삽질 과정을 기록하기 위해 적었다. 이 문제의 원인은 세 가지로 추정했다.
1. 진짜로 전원 공급 문제다?
2. 펌웨어 업데이트(25 이후) 이후에 계속 이 문제가 발생했으니, 펌웨어 문제다?
3. 이 문제가 일어나기 전에 과열된 적이 있었는데 그것 때문이다?(아발론을 발로 툭 쳤었는데, 그때 아발론의 팬 배기구가 비트엑스에 열을 직빵으로 쏴주다가 오버히트 됨. 심지어 다음 날 발견... 비트엑스야 미안해...)
그런데 이상하게도 주파수랑 전압을 낮추거나, 특정 주파수/전압을 잘 맞추면 돌아가기도 한다. 그러다가 문제를 잊을 때쯤이면 다시 Power Fault 오류가 뜨고 파업한 비트엑스를 발견할 수 있다. 스트레스 받다가 제대로 고쳐보기로 마음 먹었다. 문제 해결 과정 시작.
1. 인터넷 서칭 결과 레딧 등에서 써멀 문제란다... 팬 떼고 써멀 재도포 3번 했는데 문제는 해결되지 않았다.
2. 깃허브에서 이전 펌웨어 다운 받아서 다운그레이드 해봤으나 동일한 문제가 지속되었다. -> 펌웨어 문제는 아닌 것으로 판단.
3. 장치를 재시작하자마자 바로 대시보드 창에서 로그를 트래킹해봤다. -> 온도도 이상 없고, 다텀 게이트웨이에도 스트라텀 v1으로 잘 연결되어 있다. 하지만 이건 이미 Power Fault 문제가 뜬 이후부터의 로그만 트래킹이 가능했다.
4. 처음 재부팅할 때의 로그를 전부 보고 싶었다. 비트엑스 C타입 포트와 컴퓨터 USB 연결하고 시리얼 로그를 확인해봤다. 로그를 확인하기 위해서 깃허브에서 esphome-flasher를 다운로드 받았다. 그러면 비트엑스 연결된 USB 포트를 선택할 수 있다.
https://github.com/esphome/esphome-flasher/releases
5. 로그 확인 결과 문제가 보였다. 초반에 주파수가 올라갈 때 온도 센서가 온도를 -1도로 반환하고 있었다. 해당 로그는 다음과 같다.
[08:54:44]I (2518) power_management: Starting
...
[08:54:44]W (3018) power_management: AP mode with invalid temperature reading: -1.0°C - Setting fan to 70%
...
[08:54:48]W (6658) power_management: Ignoring invalid temperature reading: -1.0°C
온도 센서가 -1도를 반환하고, 이 때문에 전력 제한이 들어간 것이었다. 이건 온도 센서가 '응답 없음' 값을 반환하는 거라고 한다.
그런데 이상한 건... 주파수가 다 올라간 이후에는 온도 센서가 다시 제대로 된 값을 반환한다.
[08:55:20]I (39078) power_management: Temp: 24.6°C, SetPoint: 60.0°C, Output: 25.0%
EMC2101 온도 센서가 제대로 작동하기 전에 값을 읽어와서 계속 문제가 발생하는 것 같았다.
6. 온도 센서 문제일 가능성이 크다고 생각했다. 최근에 과열된 적도 있었으니 말이다. 그래서 일단 온도 센서(U10) 접합부 확인. 육안으로는 잘 붙어있는 것 같았다.
7. BOM에 있는 U10(온도 센서, EMC2101)을 알리에서 구매할까 하다가 얼마 전 납땜 실패한 비트엑스에서 온도 센서를 떼서 붙이자 생각했다. EMC2101로 가는 전압 레귤레이터인 U3(RT9080)도 바꿀까 생각이 들었다.
8. 그러다가 진짜 정말 혹시 몰라서... 정말 전원 서플라이 문제일까 생각이 갑자기 스쳐지나갔다. 나는 채굴기나 풀 노드 등을 비롯한 모든 제품들은 항상 한국형 콘센트 규격을 맞추기 위해 PSU를 별도로 구입한다. Bitaxe는 '명호전자'에서 생산한 PSU(5V 6A, 30W)를 연결해놨는데, 여기서 문제가 발생할 리가 없다고 생각했다.
❗근데 마침 다른 명호전자 PSU 여분이 있어서... 그걸 문제가 있는 비트엑스에 연결해보니... 문제가 해결되었다. 진짜 PSU 문제였나보다. 명호전자의 전원 공급 장치도 문제가 있을 수 있다.
그런데 전원 문제인데 왜 로그에서는 온도가 -1도를 반환하는지 모르겠어서 좀 찾아봤다. 전원이나 I2C 버스에 문제가 있으면 EMC2101이 제대로 응답하지 않는 문제가 있다고 한다. 아마 초반에 전원이 안정적으로 공급되지 않다가(부팅 시 주파수 올라가는 데 전류가 쓰여서 EMC2101에는 제대로 전원이 안정적으로 공급되지 않을 수 있을 것 같음) 이후에 전원 공급이 안정화되면 온도를 제대로 반환할 수도 있을 것 같다.
아무튼... 이런 문제 발생 시 다음부터는 PSU부터 바꿔봐야겠다.
이제 여름철 시작이라 지금은 전압, 주파수 전부 최저로 내린 상태다. 아발론도 Low로 바꿔놨다. 여름에도 비트코인 잘 지켜보자 채굴기들아~!