El xiulet va esclatar, el marcador es va aturar a les 9: 0, i el Robot Humanoide de l'evolució accelerat T1 va guanyar el trofeu de campionat de la final del grup adult de l'Open Robocup German. Cheng Hao es va adonar del somni del campionat que va començar amb l'equip de Tsinghua Vulcan.
Robocup és conegut com la "Copa del Món de Robot". L’equip de Tsinghua Vulcan va ser fundat per Zhao Mingguo i ha participat en la competició durant molts anys. Els membres provenen del seu laboratori de robòtica. Cheng Hao, que es va graduar al Departament d'Automatització de la Universitat de Tsinghua, va ser el tercer capità. La seva experiència de dirigir l'equip a guanyar el tercer lloc del grup Humanoid Group-Sige durant el seu període estudiantil va ser tant el punt de partida del seu somni de robot com un penediment persistent.
La seva trajectòria professional després de la seva graduació semblava desviar -se de la seva intenció original: Cheng Hao va fundar el "Calendari Chao XI" i es va convertir en el vicepresident de productes Feishu després de ser adquirit per bytedance. Tot i això, l’avanç tecnològic de Chatgpt3. 0 el 2023 li va permetre capturar amb intensitat el punt d’inflexió clau. La combinació de la capacitat d’emergència dels grans models i el control del moviment del robot està reconstruint la lògica subjacent de la intel·ligència encarnada. Cheng Hao es va adonar que les oportunitats creades per grans models per a robots humanoides són diferents de qualsevol moment anterior de la història. "L'AI general ha sorgit i es convertirà en multimodal, amb percepció i influència en el món físic, que requereix nous operadors de maquinari".
Aquest sentit de l’olfacte va fer que Cheng Hao va fundar l’evolució accelerada l’agost de 2023, reclutant molts antics membres de l’equip de Vulcan com a personal de R + D, i va convidar el seu professor Zhao Mingguo a unir -se com a científic en cap. Aproximadament un any després, el primer producte de robot humanoide Accelerated Evolution T1 va ser "nascut", confirmant el seu judici de futur.
Tan aviat com T1 va néixer ", va" tornar "al camp de futbol familiar de Cheng Hao gairebé immediatament. Aquesta joventut emprenedora, nascuda i criada a Pequín, està decidida a començar des de l'escena del futbol i es va adonar gradualment de la generalització intel·ligent dels robots humanoides.
"L'aprenentatge de reforç de robots és similar al dels nens que aprenen a caminar, des de rastrejar -se fins a peu i caminar, des de la pujada fins a caminar constantment, i fins a pujar pistes, passos i fins i tot saltar. És que, en el món virtual, l'entrenament de diversos robots durant unes hores és equivalent a deu anys per als humans". Cheng Hao va dir als periodistes.
T1 va guanyar la Copa Mundial de Robocup per segona vegada
Al març, a la final adulta de l'Open de Robocup alemany, la T1 accelerada es va enfrontar a l'amfitrió sudorosa alemanya com a equip blau. Al camp, una T1 al front semblava "predir" la ruta de bloqueig del rival, va passar per sobre de l'equip vermell que era un cap més alt que ell mateix, va tocar la pilota primer i va marcar un gol. La puntuació d’aquest duel es va tancar finalment a les 9: 0, i l’equip de Tsinghua Vulcan va guanyar el campionat amb un segell zero. Cheng Hao va refrescar el seu propi registre de participació.
Al juliol de 2024, va tornar al camp Robocup de nou en nom de l'equip de Tsinghua Vulcan. En comparació amb els seus dies d’estudiant, Cheng Hao ja no és només un desenvolupador de robot. Des del laboratori fins a l’arena, ha completat una transició clau en el paradigma cognitiu. En aquest moment, T1 no podia persistir en "jugar" a tot el joc. Molts robots van "perdre" i van caure a causa de la calor conjunta. En xocar amb altres robots, fins i tot hi va haver una desconnexió entre el control principal i les articulacions, i tot el robot es va alimentar i es va tancar. "Si es trenca, heu de substituir -lo immediatament." Cheng Hao va preparar 10 robots per a un partit de 2v2, però finalment va perdre davant l'equip nord -americà.
Cheng Hao no es va desanimar al no guanyar el primer partit. "Si no sou prou alt, podeu compensar -ho amb les vostres habilitats. Dominar el tribunal no és un somni!" Després del joc, aquesta frase es va escriure a l'article resum del compte públic de WeChat de l'evolució accelerada com a lema de T1.
"La closca del pit de plàstic i la closca del cap del robot s'escorquen després de ser colpejades." Això va donar mal de cap a Cheng Hao. Optimitzant materials, experiments continuats, no menys de desenes d’assaig i error, fins i tot utilitzant una bola 10-20 kg, caient des d’una alçada de dos metres, Cheng Hao finalment va trobar materials “durs” i resistents a la caiguda en una ruïna. Cheng Hao els va barrejar en motors, engranatges reductors, coixinets, claudàtors i altres components, i T1 tenia una nova "pell".
La fricció i la col·lisió són inevitables en les competicions judicials. Per tal que el control principal funcioni de manera estable i no perdi energia sota l’estat de vibració elevat després de la lluita, Cheng Hao va optimitzar el disseny de maquinari incrustat i equips de prova de vibració i gota especialment desenvolupats. Aquest dispositiu pot colpejar a una freqüència de dues forces màximes per segon durant 20 hores. "Seleccionarem algunes articulacions de cada lot per fer proves. Si poden sobreviure a 20 hores d'impacte sense danys, compliran els requisits".
Com es pot aixecar un robot ràpidament després de ser colpejat? Amb aquesta finalitat, Cheng Hao itera contínuament l'algoritme per aixecar -se. Solia prendre T 1 10 segons per aixecar -se, però ara pot augmentar -se en un segon, i la taxa d’èxit també s’ha apropat al 100% del 50%.
En un experiment, 6 T1s van jugar 3v3 els uns contra els altres. Després de 20 partits consecutius, la majoria de les articulacions no es van danyar i no es van necessitar "substituts" per salvar el joc. Després de l'experiment, la T1 va estar plena de confiança i va tornar a "tornar" a la Robocup Arena de nou, fent -se "dur" i resistent a la caiguda i "flexible" per aixecar -se, guanyant la Copa del Campionat en una sola caiguda.
D'altra banda, la majoria dels concursants (robots) encara no podien suportar la col·lisió. Per aquest motiu, l’esdeveniment va ajustar temporalment les regles per permetre a certes col·lisions que prohibissin col·lisions.
La primera etapa del Fòrum Zhongguancun va ser increïble
T1 es va presentar oficialment a l’agost de 2024. Cheng Hao va dir que amb el suport del govern municipal de Beijing, aquest dispositiu intel·ligent que porta la tecnologia d’avantguarda s’ha convertit ràpidament en una “targeta de visita tecnològica de la ciutat”, sovint assistint a esdeveniments internacionals com a “façana” per mostrar la seva en destresa i també s’estacionarà en llocs icònics com el cub d’aigua per aconseguir iteracions tècniques i a través de competicions de robot de standard.
A l'octubre de 2024, la T1 va començar la producció i l'enviament massius i va completar el lliurament de la 100a unitat a principis de març d'aquest any, marcant que la T1 ha entrat oficialment al carril ràpid de la industrialització.
El Fòrum de Zhongguancun el març d’aquest any es va convertir en un escenari per mostrar la seva força tècnica. T1 "va participar" al Fòrum Zhongguancun per primera vegada, accelerant la seva evolució. Es van enviar més d'una dotzena de màquines per aparèixer junts. Alguns van aparèixer a l’escenari d’obertura, realitzant empentes i de peu al lloc, mentre que d’altres es trobaven a l’entrada del fòrum principal per acollir els convidats, van actuar com a amfitrions a sub-forums o van jugar a futbol a la sala d’exposicions i van presentar perfectament la saviesa col·lectiva de la intel·ligència artificial mitjançant operacions col·laboradores de clústers.
Des d’una perspectiva tècnica, T1 utilitza un algorisme de control de moviment d’aprenentatge de reforç a les “cames” del robot. Desenes de milers de robots s’entrenen en un entorn de dades simulat alhora, “caminant” per diversos entorns com ara passos, pendents, superfícies suaus i carreteres rugoses. Cheng Hao va dir als periodistes: "L'aprenentatge de reforços dels robots és similar al dels nens que aprenen a caminar, des de rastrejar -se fins a posar -se en peu i caminar, des de l'escalada fins a caminar constantment, i després pujar pistes, passos i fins i tot saltar. És només que en el món virtual, diversos robots entrenen durant unes hores és equivalent a 10 anys per a humans".
Cheng Hao va assenyalar que l'aprenentatge de robots també té un mecanisme de recompensa i càstig, "però el model és més complicat". Només el model de resultats amb un bon rendiment d’entrenament té l’oportunitat de desplegar -se a la màquina real i s’utilitzen una sèrie d’algoritmes per reduir la bretxa des de la simulació fins al medi real. "El nostre algorisme de control de moviment actual no només controla les cames, sinó que també espera controlar les articulacions de tot el cos per moure's, com ara fer un tret potent. Això requereix la introducció d'algorismes d'aprenentatge d'imitació, permetent als robots imitar stickmen en un entorn simulat i, a continuació, consolidar -se mitjançant l'aprenentatge de reforç."
El model de gran intel·ligència encarnat encara té mancances, però pertany al "futur" de la indústria
A Cheng Hao li agrada jugar a futbol, i el seu robot també juga a futbol.
"Els robots que juguen a futbol són un escenari experimental altament eficient". Cheng Hao creu que els robots que juguen a futbol requereixen capacitat visual. A més d’identificar la seva pròpia posició de camp, també han d’identificar objectes com la pilota i l’objectiu. Al mateix temps, també necessiten la capacitat de presa de decisions per jutjar si són cap endavant, migcampistes o defensors, "el que fan serà diferent". A més, han d’ajustar constantment les seves decisions i cooperar entre ells a mesura que es mouen els robots del rival. Els robots que juguen a futbol també posen l'accent en el control de moviment i requereixen una alta capacitat atlètica com caminar, girar, disparar i aixecar -se. "Igual que els jugadors de futbol, les seves qualitats són relativament completes".
Als ulls de Cheng Hao, els escenaris de futbol i vida tenen requisits similars per a algoritmes subjacents a la percepció i la presa de decisions, com ara el reconeixement, el seguiment, el posicionament i l’evitació d’obstacles en la presa de decisions. Creu que "a partir dels escenaris de futbol no requereix massa preocupació pels problemes de seguretat i és relativament econòmic".
"A través dels robots jugant a futbol, estem investigant constantment algoritmes de control de moviment, percepció i presa de decisions nous". Tot i que Cheng Hao creu que l’actual model d’intel·ligència encarnat encara té mancances, pertany a la direcció futura de la indústria.
"Crec que és més fàcil iniciar un negoci a Beijing i ampliar -lo. El cost de la mà d'obra i el lloc pot ser més car i l'equip necessita obtenir millors ingressos i finançament". Va dir Cheng Hao. El 2024, Accelerated Evolution va rebre una ronda prèvia de finançament finançada conjuntament per Zhongguancun Science City i altres institucions. El nombre d’empreses de bases de Beijing, la densitat de talent i el suport d’escena també li van donar confiança en el futur.
Creu que la declaració de Musk que els robots humanoides arribaran a 10 mil milions d’unitats i hi haurà diversos models alhora, "les fàbriques, les empreses i les famílies les tenen", però això pot trigar 10 o 20 anys. Cheng Hao recorda que el primer ordinador de la comunitat quan era un nen valia 10 anys, 000 yuan, "en aquell moment, una casa de la comunitat també era de 10, 000 yuan."
Però els ordinadors, que abans eren equivalents als edificis, ja no estan fora de l'abast. El so dels teclats es pot escoltar l’un darrere l’altre als edificis d’oficines, i fins i tot la botiga de conveniència a la planta baixa pot utilitzar ordinadors per comprovar -ho. En el futur, els robots humanoides també poden ser capaços de romandre a la finestra del carrer com "Clara and the Sun", esperant que Qiao Xi els porti a casa.
