
Inilabas ng IplanRIO ng Rio de Janeiro ang Rio 3.5 noong Hunyo 13. Tinawag ito ng ahensya ng IT ng lungsod na isang frontier-class na modelo: 397 bilyong parameter, na may isang permissive open-source na lisensya, na binuo ng pamahalaang munisipal ng isang lungsod sa Global South.
Ang tiyempo ng paglulunsad ng Rio 3.5 ay perpekto: naglalaro ang Brazil sa World Cup opener nito, at nagliliyab na ang social media. Mabilis na kumalat ang mga komento tungkol dito mula Brazil hanggang sa iba pa.
Ngunit kasing bilis ng pagkuha nito ng atensyon, nagkaroon ng pagtatalo kung sino nga ba ang eksaktong lumikha ng modelo.
Ang orihinal na model card ay naglarawan sa Rio 3.5 bilang isang post-train ng Qwen 3.5 397B, ang open-base model ng Alibaba, na may bagong reasoning layer na tinatawag na SwiReasoning na idinagdag sa ibabaw. Ang gastos sa pagbuo ay iniulat na R$500,000 (hindi kinumpirma ito ng Rio), o halos $100,000 USD—halos 30 beses na mas mura kaysa sa katumbas na off-the-shelf AI system.
Ang arkitektura ay Mixture-of-Experts, na nangangahulugang humigit-kumulang 17 bilyon lamang sa 397 bilyong parameter ang gumagana sa anumang ibinigay na token. Ginagawa nitong mas mura ang inferensiya kaysa sa iminumungkahi ng headline size. Sinusuportahan din ng modelo ang vision at text, humahawak ng mahigit isang dosenang wika, at ipinapadala sa ilalim ng isang ganap na open MIT license.
Ang SwiReasoning ang teknikal na sentro. Ito ay isang training-free inference framework na dinamikong nagpapalit sa pagitan ng dalawang mode. Kapag tiwala ang modelo tungkol sa susunod na salita—mababang entropy sa probability distribution—ito ay nangangatwiran sa simpleng wika. Kapag hindi sigurado, lumilipat ito sa latent reasoning, nag-iisip sa mga nakatagong internal states nang hindi naglalabas ng tokens. Sinabi ng IplanRIO na ang Rio 3.5 ay partikular na sinanay upang samantalahin ito, at ang mga pakinabang ay lumalabas sa mga numero ng benchmark.
Ang mga numerong iniulat sa sarili ay kapansin-pansin. Ang Terminal-Bench 2.1—na sumusukat sa autonomous terminal command execution, binibigyan ng marka bilang porsyento ng mga task na napasa—ay nasa 70.8% para sa Rio 3.5, mas mataas kaysa sa Qwen 3.7 Plus na 70.3% at ang makapangyarihang DeepSeek v4 Pro na 67.9%.
Sa IMOAnswerBench, isang math olympiad benchmark na binibigyan ng marka bilang porsyento ng tamang sagot, umabot ang Rio 3.5 sa 89.5%. Sa HLE—Humanity's Last Exam, isang halos hindi malulutas na multi-domain expert battery na binibigyan ng marka bilang porsyento—lumapag ang Rio 3.5 sa 36.5%, mas mataas kaysa sa 34.7% ng Qwen 3.7 Plus.
Isang pamahalaang munisipal na tinalo ang pinakamahalagang pangunahing modelo sa pinakamakabuluhang kalidad ng mga benchmark: Iyan ang headline na kumalat, lalo na matapos itong i-tweet ng Mayor ng Rio de Janeiro.
“Isang open AI model na sinanay sa Rio at pinondohan ng publiko sa nakaraang taon ng [Municipality of Rio] ang kalalabas lang na lumampas sa lahat ng iba pang modelo,” isinulat ni Eduardo Cavaliere. “Ngayon, pinag-uusapan ng mundo ang isang open AI model na sinanay sa Rio.”
🇧🇷 Modelo de IA aberta treinada no Rio com financiamento público ao longo do último ano pela @Prefeitura_Rio superando todos os outros modelos. Inteligência artificial não é uma coisa distante, estrangeira, de laboratório bilionário…não existe só pra fazer texto, imagens… https://t.co/GK1ThytVV9
— Eduardo Cavaliere (@CavaliereRio) June 14, 2026
Ang "Trained in Rio" ay hindi napatunayang ganap na tumpak.
Ang Nex-AGI, isang Shanghai-based na open-source AI alliance, ay nag-post sa X ilang araw pagkatapos ng paglabas. Ang panimula: "Ang Rio 3.5 model ay naging viral sa internet ngayong linggo. Ang plot twist? Mahalaga, ito ang aming open-source model, Nex N2 Pro, na may ibang anyo."
Sinuri nila ang mga timbang. Ang matematika ay eksakto: Rio 3.5 ≈ 0.6 × Nex N2 Pro + 0.4 × Qwen 3.5. Isang verification script at isang buong GitHub report ang sumunod.
The Rio 3.5 model broke the internet this week. The plot twist? It’s essentially our open-source model, Nex N2 Pro, wearing a different hat.
🤯 We analyzed the weights, and the recipe is exact: Rio 3.5 ≈ 0.6 * Nex N2 Pro + 0.4 * Qwen 3.5
It even literally introduces itself… pic.twitter.com/yHRRu37aut
— Nex (@NexEcosystem) June 14, 2026
Ang ebidensya ay dumating sa dalawang bahagi.
Una, ang asal. Inalis ng Nex ang hardcoded na "You are Rio" system prompt mula sa inilabas na modelo at nagpadala ng 120 tanong tungkol sa pagkakakilanlan. Kung walang maskara, iniulat ng Nex na tinawag ng modelo ang sarili nito na "Nex, from Nex-AGI" ng 79.2% ng oras. Tinawag nito ang sarili nito na "Rio" ng eksaktong 0% ng oras. Sinabi ng Nex na binigkas din ng modelo ang tiyak na backstory ng kumpanya nang verbatim, binanggit ang "Shanghai Innovation Institute" at "isang large-model ecosystem alliance." Iyon ang sariling training data ng Nex, na lumalabas sa modelo ng iba.
Pangalawa, matematikal. Sa isang tunay na weight merge, bawat parameter sa bagong modelo ay nakaupo sa isang tuwid na linya sa pagitan ng dalawang source models. Sinukat ng Nex ang collinearity na ito sa lahat ng 60 layers. Ang resulta ay bumalik sa 0.993. Dalawang hindi magkakaugnay na modelo sa parehong parameter space ang nakakuha ng halos zero nang nagkataon. Ang pagtama ng 0.993 sa bawat isang layer ay hindi isang pagkakapareho. Ang mixing ratio ay nanatili sa α ≈ 0.571, matatag sa tatlong decimal places.
Karaniwan, ito ay halos 60% Nex, at ang natitira ay ang base Qwen model.
"Ang bawat weight tensor sa Rio ay, sa libu-libong standard deviations, ang parehong 0.6/0.4 blend ng Nex at Qwen—sa lahat ng 60 layers at bawat bahagi ng network," isinulat ni Nex. "Walang inosenteng paliwanag."
Ang mga numero ay nagkwento din ng mas tahimik na istorya. Ang Nex N2 Pro, na inilabas ilang araw lamang bago ang Rio 3.5, ay nakakuha ng 75.3% sa Terminal-Bench 2.1—mas mataas kaysa sa 70.8% ng Rio. Sa GDPval, isang economic forecasting benchmark na binibigyan ng marka bilang isang Elo-style rating, ang Nex ay nasa 1,585 laban sa 1,533 ng Rio. Kung ang Rio ay 60% Nex, kung gayon ay aasahan mong makakuha ito ng mas mababa kaysa sa Nex sa sariling mga benchmark ng Nex. At ito nga.
In-update ng IplanRIO ang Hugging Face model card—tinanggal ang benchmark table at binago ang atribusyon.
"Ang modelo ay binuo sa pamamagitan ng pagsasanib ng nex-agi/Nex-N2-Pro at Qwen/Qwen3.5-397B-A17B, na sinundan ng On-Policy Distillation mula sa isang mas malakas na modelo," sabi ng updated na Readme. "Nakita namin ang isang maling pag-upload sa nakaraang bersyon, kung saan ang base merged version ang na-upload sa halip na ang final distilled model. Humihingi kami ng paumanhin sa pagkalito at taos-pusong humihingi ng tawad."
Wala nang ibang pampublikong pahayag mula sa IplanRIO. Kinikilala na ngayon ang Nex.
Ang "maling pag-upload" na paliwanag ang pangunahing pahayag. Sinasabi ng IplanRIO na ang nilalayon na paglabas ay isang distilled na bersyon ng pinagsamang base—hindi ang raw merge mismo. Ang on-policy distillation ay nangangahulugan na ang isang mas malakas na teacher model ay bumubuo ng mga output, at ang estudyante ay nagsasanay sa mga ito habang bumubuo din ng sarili nito. Ito ay mas mahal kaysa sa isang raw merge, ngunit mas mura pa rin kaysa sa pag-train mula sa simula. Kung totoo ang hakbang na iyon, kung gayon ito ay kumakatawan ng hindi bababa sa ilang orihinal na gawain sa ibabaw ng merge.
Ang aktwal na nai-ship, ayon sa IplanRIO, ay ang merged base na walang anuman sa itaas.
Nagkahiwalay ang mga tagamasid ng komunidad sa kung ano ang ibig sabihin nito. Nagbigay si Rafael Quintanilha, isang komentarista sa tech, ng mas maawain na pagbasa: Dahil ang Nex N2 Pro mismo ay binuo sa Qwen, maaaring kinilala ng team ang pinagbabatayang arkitektura at hinayaan na lang doon. Itinuro din niya na naging viral ang modelo sa panahon ng World Cup match, "hindi naman necessarily 'ready for public consumption.'"
about the Rio 3.5 situation
merging two ~400B-class models and then applying policy distillation isn’t trivial
that said, they made two mistakes:
- a technical error (probably caused by a lack of attention to detail)
- and a communication one (we can debate the integrity of…
— montano (@lucas_montano) June 15, 2026
Binanggit ng developer at AI YouTuber na si Lucas Montano na "ang pagsasama-sama ng dalawang ~400B-class na modelo at pagkatapos ay paglalapat ng policy distillation ay hindi madali"—habang kinikilala ang parehong teknikal na pagkakamali at pagkabigo sa komunikasyon.
Si AI researcher Diego Ambrosio ay hindi gaanong mapagbigay. Ang orihinal na paglulunsad ay naglalarawan sa Rio 3.5 bilang resulta ng "autonomous post-training at proprietary fine-tuning"—isang paglalarawan na nagpapahiwatig ng orihinal na pananaliksik, hindi isang merge.
Ang pagsasama-sama ng modelo ay ganap na legal. Ang Nex N2 Pro ay Apache 2.0—maaari mo itong gamitin, baguhin, at ipamahagi, basta't kilalanin mo ito. Ang Qwen 3.5 ay open-licensed din. Walang pupunta sa korte dito.
Ang problema ay ang pagpapakita ng output bilang independiyenteng nabuong gawain nang hindi binabanggit ang *lahat* ng source models. Nakita na ito ng open-source community noon. Mas maaga ngayong taon, natuklasan na ang Composer 2 ng Cursor ay binuo sa Kimi K2.5 ng Moonshot nang walang pahayag. Ang backlash ay mabilis at reputasyonal—walang abogado, screenshots lang.
was messing with the OpenAI base URL in Cursor and caught this
accounts/anysphere/models/kimi-k2p5-rl-0317-s515-fast
so composer 2 is just Kimi K2.5 with RL
at least rename the model ID https://t.co/MQOuEuF3Pd pic.twitter.com/fyUWbo1InF— fynn (@fynnso) March 19, 2026
Normal ang pagbuo batay sa mga umiiral na open model. Tulad ng nailathala ng *Decrypt*, ang pagpapataong at pagsasama-sama ng mga open weight ay halos isang subculture. Ang pamantayan ay hindi "huwag bumuo batay sa gawa ng iba." Ang pamantayan ay: Sabihin kung ano ang ginamit mo.
Ang naging sanhi ng mas malakas na usapan kaysa sa tipikal na pagkakamali sa atribusyon ay ang institusyonal na balot. Ang isang pseudonymous developer na nagpapadala ng isang frankenmerge sa ilalim ng sarili nitong pangalan ay isang bagay. Ang isang pamahalaang munisipal na ginagamit ito upang mag-angkin ng soberanya ng AI sa sektor ng publiko—sa panahon ng World Cup—ay ibang bagay. "Sayang lang ang mga resources," isinulat ng isang komentaristang Brazilian.
Hindi ginawang gera ni Nex ang isyu. "Kami ay nalulugod na ginamit ng Lungsod ng Rio ang aming trabaho upang makamit ang SOTA performance," isinulat ng kumpanya sa X. "Ngunit sa mundo ng open-source, mahalaga ang atribusyon."
Nagsusumikap ang IplanRIO na i-upload ang naitama, distilled na modelo na may kumpletong atribusyon. Kapag nalathala iyon, muling isasagawa ang parehong mga pagsusuri—at malalaman ng komunidad kung ang distillation ay talagang nagbago ng anuman, o kung ito ay nananatili pa ring Nex na may ibang system prompt.