CRYPTO MINING PRO
¿Cómo reparar la placa hash de Antminer S19j pro+?
Ⅰ. Plataforma de mantenimiento/requisitos de preparación de herramientas/equipos
1. Requisitos de la plataforma:
Banco de trabajo de reparación estática (el banco de trabajo debe estar conectado a tierra), pulsera antiestática y conexión a tierra.
2. Requisitos del equipo:
Soldador de temperatura constante (350 grados-380 grados), la punta del soldador puntiaguda se utiliza para soldar parches pequeños como resistencias y condensadores de chip. Una pistola de aire caliente, una estación de calentamiento (350 ℃-400 ℃) y una estación de retrabajo BGA se utilizan para desmontar y soldar chips/BGA. Multímetro, agregue pasadores de acero soldados y ponerse tubo termorretráctil para una fácil medición (se recomienda Fluke). Osciloscopio, cable de red (requisitos: conectado a Internet, red estable).
3. Requisitos de la herramienta de prueba:
Fuente de alimentación APW12 (la máquina en sí utiliza la fuente de alimentación), cable adaptador de alimentación DIY: los polos positivo y negativo de la fuente de alimentación utilizan cables de cobre gruesos para conectar la fuente de alimentación y la tablero de hash. Se recomienda utilizar un cable de cobre de 4 AWG con una longitud de 60 cm, limitado a PT1 y pruebas de mantenimiento, para la alimentación de la placa hash. Utilice el V2.1 o V2.3 accesorio de prueba de la placa de control (número de pieza del accesorio de prueba ZJ0001000001). Los polos positivo y negativo de la fuente de alimentación del accesorio de prueba deben estar equipados con resistencias de descarga. Se recomienda utilizar resistencias de cemento de 20 ohmios y más de 100 W.
4. Requisitos para los materiales/herramientas auxiliares de reparación:
Pasta de soldadura M705, fundente, agua de lavado de la placa con alcohol anhidro (el agua de lavado de la placa se utiliza para limpiar los residuos de fundente después de la reparación). Grasa térmica (se utiliza para aplicar sobre la superficie del chip después de la reparación). Malla de acero estañada (tamaño del chip de 6 mm * 6 mm), alambre desoldador, bola de estaño (diámetro de bola recomendado: 0,4 mm). Al reemplazar un chip nuevo, es necesario estañar los pines del chip y luego soldarlos a la placa hash. Aplique grasa de silicona conductora térmica uniformemente sobre la superficie del chip y luego cerradura el disipador de calor de refrigeración por agua.
5. Requisitos comunes de material de repuesto de reparación:
Resistencia 0402 (0R, 33R, 51R, 10K, 4,7K), condensador 0402 (0,1 uf, 1 uf).
Ⅱ. Requisitos de reparación
1. Preste atención al método de trabajo al reemplazar el chip. No habrá deformaciones obvias en la placa PCB después de reemplazar ningún accesorio. Verifique si hay problemas de circuito abierto o cortocircuito en las piezas de repuesto y las piezas circundantes.
2. El personal de mantenimiento debe tener ciertos conocimientos electrónicos, más de un año de experiencia en reparaciones y ser competente en tecnología de soldadura de empaquetado BGA/QFN/LGA.
3. Después de la reparación, la placa hash debe probarse más de dos veces y ambas están bien antes de poder pasar la prueba.
4. Verifique si las herramientas de reparación y los accesorios de prueba pueden funcionar normalmente y determine los parámetros del software de prueba de la estación de reparación, las versiones de los accesorios de prueba, etc.
5. Para realizar pruebas después de reparar y reemplazar el chip, primero debe pasar el chip de detección PT1 y luego realizar la prueba funcional. La prueba funcional debe garantizar que el disipador de calor de tamaño pequeño esté bien soldado y que el disipador de calor de tamaño grande esté instalado en su lugar (asegúrese de instalar el disipador de calor grande después de aplicar uniformemente grasa de silicona conductora térmica) y que el ventilador de enfriamiento esté a máxima velocidad. Para utilizar la refrigeración del chasis, se deben colocar 2 placas hash al mismo tiempo para formar un conducto de aire.
6. Al medir señales, se utilizan 4 ventiladores para disipar el calor y los ventiladores mantienen la velocidad máxima.
7. Al encender la placa hash, primero debe conectar el cable de cobre negativo de la fuente de alimentación, luego conectar el cable de cobre positivo de la fuente de alimentación y, finalmente, enchufar el cable de señal. El orden de desmontaje debe ser inverso al orden de instalación. Retire primero el cable de señal, luego el cable de cobre positivo de la fuente de alimentación y, finalmente, el cable de cobre negativo de la fuente de alimentación. Si no sigue este orden, es muy fácil dañar U1 y U2 (no se pueden encontrar todos los chips). Antes de probar el patrón, la placa hash reparada debe enfriarse antes de la prueba; de lo contrario, causará la prueba PNG.
8. Al reemplazar un chip nuevo, se deben imprimir los pines y la pasta de soldadura para garantizar que el chip esté preestañado y luego soldado a la PCBA para su reparación.
9. El chip del modelo BHB42611 es un proceso BSM, es decir, la superficie del chip utiliza un proceso de recubrimiento de cobre. El disipador de calor se suelda directamente al chip con estaño. Durante la reparación, es necesario quitar primero el disipador de calor que está sobre el chip. La temperatura de la pistola de aire caliente se ajusta a 400 °C. La boquilla de la pistola de aire está a 0,5 cm por encima del disipador de calor. El tiempo de calefacción es de 15 segundos y se puede quitar el disipador de calor. Luego, use la misma temperatura y método para soplar el disipador de calor en la parte posterior del chip, y use la misma temperatura y tiempo para quitar el disipador de calor en la PCBA en la parte posterior del chip. Finalmente, suelde el chip utilizando métodos convencionales.
Ⅲ. Producción de accesorio de prueba y precauciones
El conjunto de accesorio de prueba debe satisfacer la disipación de calor de la placa hash y facilitar la medición de la señal.
1. Número de material: ZJ0001000001 accesorio de prueba.
2. Cuando utilice el accesorio de prueba de la serie 19 por primera vez, utilice el programa de flash de la tarjeta SD para actualizar el FPGA en la placa de control del accesorio. Después de la descompresión, cópielo a la tarjeta SD e inserte la tarjeta en la ranura para tarjeta del accesorio de prueba. Encienda durante aproximadamente 1 minuto y espere a que la luz indicadora en la placa de control parpadee doble destello tres veces antes de que se complete la actualización (si no se actualiza, es posible que se informe que un chip determinado está defectuoso durante la prueba).
Figura 3-1
3. Producción de tarjeta SD sin disipador de calor: la reparación utiliza el programa PT1 de código de escaneo, como se muestra en la captura de pantalla a continuación, este programa se puede probar sin código de escaneo. El técnico de reparación debe disipar el calor de la PCBA al medir para evitar que la placa se sobrecaliente durante la prueba y la medición.
Figura 3-2
4. Producción de tarjeta SD sin disipador de calor: La prueba de 8x Patter con disipador de calor de doble cara requiere la producción de una tarjeta SD, como se muestra en la figura siguiente. Cambie el nombre del archivo config.ini-BBK10601-PT2 a config.ini. No es necesario conectar el escáner de códigos al probar PT2, solo conecte el cable de red. Consulte el método de disipación de calor de producción para conocer el método de disipación de calor (elemento: inserte la placa en el chasis y bloquee los tornillos, encienda la placa, los ventiladores deben estar a máxima velocidad y la temperatura ambiente debe ser inferior a 30 °C).
Figura 3-3
Ⅳ. Descripción general del principio
1. Estructura de funcionamiento de la placa hash BHB42611:
La placa hash consta de 120 chips BM1362 divididos en 40 grupos (dominios), cada grupo consta de 3 IC. El chip BM1362 utilizado en la placa hash BHB42611 funciona a 0,3 V. Los grupos 40, 39, 38, 37, 36, 35 y 34 (7 grupos en total) reciben alimentación de la salida de 19 V del circuito elevador U283 al LDO. Haga que los LDO de estos 4 dominios emitan 1,2 V y 0,8 V. La fuente de alimentación de los LDO de dominio restantes es una entrada VDD15V y una salida de 1,2 V y 0,8 V.
(Prueba PT2, la página de registro de la computadora comienza a contar desde asic0, consulte la Figura 4-1)
Figura 4-1
(El dominio de voltaje en el récord de prueba comienza desde 0, es decir, dominio 0, consulte la Figura 4-2)
Figura 4-2
2. Circuito elevador de la placa hash BHB42611:
El circuito elevador convierte la fuente de alimentación de 15 V a 19 V, como se muestra en las Figuras 4-3 y 4-4.
Figuras 4-3
Figuras 4-4
3. Dirección de la señal del chip BHB42611:
1) Dirección del flujo de la señal CLK (XIN): generada por el oscilador de cristal Y1 25M, transmitida desde el chip 01 al chip 120.
2) Dirección del flujo de la señal RST: desde el pin 3 de la interfaz IO, y luego transmitida desde el chip 01 al chip 120.
3) Dirección del flujo de la señal CI: desde el pin 7 de la interfaz IO, y luego transmitida desde el chip 01 al chip 120.
4) Dirección del flujo de la señal RX (RI, RX): desde el chip 120 al chip 01.
5) Dirección del flujo de la señal BO (BI, BO): desde el chip 01 al chip 120.
Figura 4-5
4. Estructura de toda la máquina:
Toda la máquina consta principalmente de 3 placas hash, 1 placa de control, fuente de alimentación APW121417b y 4 ventiladores de refrigeración, como se muestra en la Figura 4-6.
Figura 4-6
Ⅴ. Fenómenos adversos comunes y resolución de problemas de las placas hash
1. Fenómeno: el chip de detección de prueba de placa única está en 0 (estación PT1/PT2)
Paso 1: primero verifique la salida de potencia.
Paso 2: verifique la salida de voltaje del dominio de voltaje.
Si hay una fuente de alimentación de 15 V, generalmente hay un voltaje de dominio. Priorice la medición de la salida del terminal de potencia de la placa hash.
Paso 3: verifique la salida del circuito elevador.
Prueba: la posición C29 puede medir un voltaje de 19 a 20 V.
Figura 5-1
Figura 5-2
Paso 4: verifique la salida de LDO 1.2 V o PLL 0.8 V de cada grupo.
Figura 5-3
Figura 5-4
Figura 5-5
Paso 5: verifique la salida de señal del chip (CLK/CI/RI/BO/RST).
Consulte el rango de valores de voltaje descrito en la descripción de la dirección de la señal. Si hay una desviación significativa en los valores de voltaje medidos, compárelos con las mediciones del grupo adyacente para determinarlo.
Figura 5-6
2. Fenómeno: detección de chip incompleta en la placa única (estaciones PT1/PT2)
a) Cuando la pantalla LCD muestra ASIC NG: (0), primero mida el voltaje general del dominio y verifique si el circuito elevador de 20 V es normal. Luego, use una sonda de cortocircuito para cortocircuitar el punto de prueba RX entre el primer y el segundo chip y el punto de prueba 1V2, y luego ejecute el programa de búsqueda de chip. Observe el registro del puerto serial, si aún se encuentran 0 chips, podría ser una de las siguientes situaciones:
a-1) Mida el voltaje en los puntos de prueba 1V2 y 0V8 con un multímetro para ver si es 1.2V y 0.8V. Si no es así, podría ser un problema con el circuito LDO de 1.2V o 0.8V en ese dominio, o el chip principal en este dominio podría no estar bien soldado. O podría haber un cortocircuito causado por los condensadores de filtrado SMD a 0,8 V y 1,2 V, o podría haber problemas como soldadura en frío, soldadura falsa o daño material en el circuito LDO.
a-2) Compruebe si hay anomalías en el circuito U2, como soldadura falsa en las resistencias.
a-3) Compruebe si el primer chip tiene pines sin soldar (se ha observado en reparaciones que los pines parecen soldados de lado, pero al quitar el chip, los pines en realidad no están soldados en absoluto).
b) Si en el paso a), se encuentra 1 chip, indica que el primer chip y el circuito anterior están bien. Utilice un método similar para inspeccionar los chips posteriores. Por ejemplo, haga un cortocircuito en el punto de prueba 1V2 entre los chips 23 y 24 y el punto de prueba RX. Si el registro encuentra 23 chips, entonces los 23 chips anteriores están bien; si aún encuentra 0 chips, primero verifique si ese 1V2 es normal. Si es así, el problema está en los chips posteriores al 23. Continúe utilizando un método de búsqueda binaria para identificar el chip problemático. Supongamos que el chip N es problemático, entonces el cortocircuito 1V2 y RX entre los chips N-1 y N encuentra N-1 chips, pero el cortocircuito entre los chips N y N+1 en 1V2 y RX no encuentra todos los chips.
c) Pantalla LCD del accesorio de prueba exhibir ASIC NG: X (siempre informa un chip específico), hay dos escenarios:
El primer caso: (por lo general, el valor del chip informado no cambia en cada prueba). En este caso, simplemente siga el método de reparación normal de medir el voltaje de la señal y realice la reparación. (También podría ser una colisión de resistencias cerca del chip).
El segundo caso; el tiempo de prueba es casi el doble que el de la placa en buen estado (a veces el valor de X cambiará cada vez que realice la prueba y, a veces, X = 0); en este momento, el registro generalmente tiene la siguiente información (a veces, el número rojo no es 13, según el asiento al que esté conectado el accesorio de prueba); durante la prueba, suponga que el voltaje de dominio de todos los campos frente a la posición anormal es casi menor a 0,3 V y el voltaje de dominio de los campos posteriores es casi todos mayor a 0,34 V; Esta situación es provocada por que el chip no está bien soldado; por lo general, 1,2 V, 0,8 V, RXT y CLK no están bien soldados. Se recomienda medir directamente el voltaje de dominio para localizar cuál dominio es el problema. Los métodos de cortocircuito 1V2 y RO utilizados en la sección 1 también pueden localizar la posición anormal.
Figura 5-7
3. Fenómeno: Patrón NG de placa única, respuesta incompleta de datos nonce (estación PT2).
El patrón NG se produce debido a diferencias significativas en las características de un chip en comparación con otros. Se ha descubierto que el chip está dañado, por lo que solo es necesario reemplazar el chip. Según la información del registro de prueba, las reglas de reemplazo son:
1)Verifique la calidad de la impresión de la pasta térmica.
2)Si la apariencia del chip está intacta, reemplace el chip con la tasa de respuesta más baja en cada dominio.
3)Intercambie chips con tasas de respuesta más altas y más bajas para ver si el problema sigue al chip. Si es así, reemplace el chip. Si no es así, verifique si el voltaje en ese dominio es más bajo de lo normal y mida si la resistencia de las almohadillas del chip es normal. Si hay una diferencia, verifique si las pequeñas resistencias adyacentes tienen valores de resistencia anormalmente altos. Si es así, reemplácelas.
PD: Es importante tener en cuenta que tanto la numeración del dominio como la del ASIC comienzan desde 0.
Figura 5-8
Figura 5-9
4. Fenómeno: B_A X PCS (respuesta insuficiente en X chips)
Cambie estos pocos chips por aquellos que tengan tasas de respuesta más altas en otros dominios para ver si es efectivo. Si no, simplemente reemplace estos chips.
5. Fenómeno: la prueba del chip está bien, pero el puerto serial de prueba funcional PT2 no se detiene (funcionamiento continuo).
Método de reparación: Durante la prueba PT2, observe el registro de impresión del puerto serial. Cuando el puerto serial comience a funcionar continuamente, use una sonda de cortocircuito para cortocircuitar RX y 1.2V. Comience a hacer cortocircuito desde el primer chip, si el puerto serial deja de funcionar continuamente después del cortocircuito, indica que el primer chip está bien. Continúe con este método hasta que encuentre el chip que, cuando se cortocircuita, aún causa el problema de funcionamiento continuo. Generalmente, esto se debe a un chip defectuoso, que debe reemplazarse.
Figura 5-10
Requisitos para el entorno de prueba PT2: La temperatura para la prueba PT2 debe estar entre 20 y 30 grados Celsius. Si la temperatura ambiental supera los 35 grados, el software detendrá la prueba. Se requiere disipación de calor durante la medición. Como se muestra en la figura, la plataforma de disipación de calor se puede utilizar para disipar el calor para las mediciones PT1 y ejecutar el firmware DEBUG.
Figura 5-11
6. Error de dirección de chip (PT2)
Método de reparación: Reemplace el chip que informa el error.
7. Para PNG donde la respuesta NONCE es baja, primero, intercambiar con por un buen chip. Si el problema persiste en el chip, reemplace el chip defectuoso.
8. La placa única funciona bien, pero la máquina completa pierde la tasa de hash.
1)Uno de los chips tiene respuestas RX erráticas.
2)La fuente de alimentación LDO de un dominio determinado es inestable, posiblemente debido a valores de resistencia anormales de las resistencias en serie con él.
Ⅵ. Problemas en la placa de control que provocan los siguientes problemas
1. La máquina completa no funciona
1) Compruebe si los voltajes en varios puntos de salida son normales. Si hay un cortocircuito a 3,3 V, primero puede desconectar U8. Si sigue en cortocircuito, retire la CPU y mida de nuevo. Para otros voltajes anormales, generalmente reemplace el IC de conversión de voltaje correspondiente.
2) Si los voltajes son normales, verifique el estado de la soldadura de la DDR/CPU (inspección por rayos X en el extremo de producción).
3) Intente actualizar el programa flash mediante una tarjeta SD:
Para las máquinas que necesitan un inicio normal después de ser flasheadas con una tarjeta, se requieren los siguientes dos pasos:
a) Después de flashear con éxito, el indicador LED verde permanecerá encendido. En este momento, apague y reinicie.
b) Después de volver a encender, espere 30 segundos (el tiempo que tarda en abrirse OTP).
OTP (One Time Programmable) es un tipo de memoria en MCU, lo que significa que se puede programar solo una vez: una vez que el programa se graba en el IC, no se puede cambiar ni borrar nuevamente.
Precauciones:
Si hay un corte de energía repentino durante el proceso OTP o si el tiempo es menor a 30 segundos, puede provocar que la función OTP de la placa de control falle, lo que provocará que la placa de control no se inicie (no se conecta a la red). En este caso, reemplace U1 (el control principal IC FBGA en el tablero de control). El U1 reemplazado no se debe volver a utilizar en la serie 19.
Para las placas de control con la función OTP activada, U1 no se debe utilizar en otras series de máquinas.
Figura 6-1
2. La máquina completa no puede encontrar una dirección IP
La incapacidad de encontrar una dirección IP probablemente se deba a anomalías operativas. Consulte el punto 1 para la resolución de problemas.
Verifique el puerto de red, el transformador de red T1 y la apariencia y la soldadura de la CPU.
3. La máquina completa no se puede actualizar
Verifique el puerto de red, el transformador de red T1 y la apariencia y la soldadura de la CPU.
4. La máquina completa no puede leer los tableros hash o tiene una cadena perdida
A. Verifique el estado de las conexiones del cable plano.
B. Verifique los componentes correspondientes a la cadena en la placa de control.
C. Inspeccione la calidad de la soldadura por ola en los pines del conector y las resistencias alrededor de la interfaz del conector.
Figura 6-2
Ⅶ. Síntomas de falla de la máquina completa
1. Prueba inicial de la máquina completa
Consulte el documento de procedimiento de prueba. Generalmente, los problemas que surgen se deben a problemas del proceso de ensamblaje o problemas del proceso de la placa de control.
Síntomas comunes: incapacidad para detectar IP, detección de número de ventilador anormal y anomalías en la detección de la cadena. Si se producen anomalías durante las pruebas, se debe realizar el mantenimiento de acuerdo con la interfaz de monitoreo y las indicaciones del registro de pruebas. Los métodos de reparación durante la prueba inicial y la prueba de envejecimiento de toda la máquina son los mismos.
Figura 7-1
2. Prueba de envejecimiento: durante la prueba de envejecimiento, las reparaciones deben basarse en la prueba de la interfaz de monitoreo.
1) Visualización anormal del ventilador: verifique si el ventilador está funcionando correctamente, si la conexión a la placa de control es normal y si hay alguna anomalía en la placa de control.
2) Cadena faltante: esto generalmente significa que falta una de las tres placas. Esto se debe principalmente a problemas en la conexión entre la placa hash y la placa de control. Inspeccione los cables de cinta para detectar problemas de circuito abierto. Si la conexión está bien, realice una prueba PT2 en la placa única para ver si pasa. Si es pasar, es probable que haya un problema con la placa de control. Si no pasa, use el método de reparación PT2.
3) Anomalía de temperatura: generalmente, esto se refiere a altas temperaturas. El sistema de monitoreo establece una temperatura máxima de PCB de 90 grados Celsius. Si supera los 90 grados, la máquina emitirá una alarma y no funcionará correctamente. Esto generalmente se debe a altas temperaturas ambientales o al funcionamiento anormal del ventilador. (BHB42611 tiene solo dos sensores de temperatura).
4) Imposibilidad de encontrar todos los chips, cantidad insuficiente de chips: si la cantidad de chips es insuficiente, consulte la PT1 prueba para realizar reparaciones.
5) Pérdida de la tasa de hash después de funcionar durante un tiempo, conexión al grupo de minería interrumpida: verifique la red.
6) Estado normal de la prueba de envejecimiento de máquinas de buena calidad.
Figura 7-2
Figura 7-3
Ⅷ.Otras precauciones
Diagrama de flujo de reparación
Figura 8-1 Diagrama de flujo de reparación
● Inspección de rutina: primero, inspeccione visualmente la placa hash que se va a reparar y verifique si hay deformaciones en la PCB o signos de quemado. Si están presentes, estos deben abordarse primero. Verifique si hay signos obvios de piezas quemadas, piezas que se hayan desplazado debido al impacto o señales de piezas faltantes. A continuación, si no hay problemas visuales, comience por verificar la impedancia en cada dominio de voltaje para detectar cortocircuitos o circuitos abiertos. Si encuentra alguno, debe abordarlo primero. Luego, verifique si el voltaje de cada dominio es de alrededor de 0,32 V.
● Después de pasar la inspección de rutina (generalmente, la prueba de cortocircuito en la inspección de rutina es esencial para evitar que se quemen los chips u otros materiales cuando se enciende), use un accesorio de prueba para verificar los chips y tomar decisiones en función de los resultados.
● Según los resultados de la pantalla del accesorio de prueba, comenzar cerca del chip defectuoso y verifique los puntos de prueba del chip (CO/NRST/RX/XIN/BI) y los voltajes como VDD0V8, VDD1V2, etc.
● Luego, siga la dirección de la señal, notando que la señal RX viaja en reversa (del chip 120 al 1), mientras que otras señales como CLK, CO, BO, RST viajan hacia adelante (del 1 al 120). Localice puntos de falla anormales a través de la secuencia de energía.
● Cuando identifique el chip defectuoso, debe volver a soldarlo. Aplique fundente (preferiblemente fundente sin limpieza) alrededor del chip y caliente cada punto de soldadura de los pines del chip hasta que se derritan, permitiendo que los pines del chip se vuelvan a alinear con las almohadillas y se vuelvan a estañar. Si el problema persiste después de volver a soldar, reemplace el chip directamente.
● Después de reparar la placa hash, debe pasar la prueba del accesorio de prueba al menos dos veces antes de considerarse buena. En primer lugar, después de reemplazar los componentes y dejar que la placa hash se enfríe, pruébela con el accesorio de prueba y déjela a un lado para que se enfríe nuevamente. En segundo lugar, después de unos minutos cuando la placa hash se haya enfriado por completo, pruébela nuevamente.
● Una vez que la reparación de la placa hash esté bien, mantenga registros relacionados con la reparación/análisis (requisitos del informe de reparación: fecha, SN, versión de PCB, número de posición, causa de la falla, responsabilidad del defecto, etc.).
● Luego de expediente, ensámblelo en una máquina completa para el envejecimiento de rutina.
● En el caso de las placas hash reparadas, se debe quitar el gel térmico y reimprimir el disipador de calor grande.