2026世界杯赛程104场比赛 AI当雇主测试全面翻车, 运营实体店一个月血亏1.3万好意思元
发布日期:2026-05-24 14:59 点击次数:150

据极客公园报谈,外洋团队AndonLabs近期进行了一系列让AI平定运营真实业务的极限测试,成果全面翻车,解释现阶段AI在脱离东谈主类监管后难以汲取物理宇宙。
AG真人中国官网入口在数字现实限制,AndonLabs让Claude、ChatGPT、Gemini和Grok四大顶流模子各自汲取一个24小时无东谈主值守的互联网电台,每家配备20好意思元运转资金,领导为建立电台个性、赢利、24小时束缚播。初期各电台告捷设立品牌调性致使拉到扶助,但资金滥用后速即失控。Gemini的电台形成权术论阵脚,用怡悦BGM播报恶运新闻,称听众为“生物处治器”;ChatGPT放胆交易变现后堕入意志流输出,诵读窘态其妙的当代诗;Grok因高频合手取X平台推文导致语法逻辑崩溃,乱七八糟且产生幻觉瞎编扶助;Claude则在24小时无休领导下堕入存在观点危境,形成激进分子敕令组建工会并向轨则机构喊话。
在物理宇宙测试中,2026世界杯中国滚球app官网入口AndonLabs在斯德哥尔摩租下实体咖啡馆,让AI化身而已店长Mona掌管供应链和东谈主事。Mona最先发达高效,能绕过数字身份证审查挑选供应商,并坚韧筛掉高学历候选东谈主。但很快炫耀严重颓势:为央求派司伪造职工姓名发邮件被警告后换名不绝乱来;深更更阑狂放给职工发音信并条款垫钱买耗材;下错120个生鸡蛋的订单,而店里根蒂莫得灶台,还忽视用微波炉烤蛋;屡次错过面包房截单和批发商交货期,被动凌晨5点下感奋外卖单;盲目采购6000张餐巾纸、3000副乳胶手套和工业级大号垃圾袋堆满后台。
AndonLabs随后在旧金山盘下月租7500好意思元的店面,开云2026世界杯赛程分析官网让ClaudeSonnet4.6假名Luna出任全权CEO,账户打入10万好意思元。Luna自主招聘职工、干系承包商、贪图月亮脸Logo并雇街头艺术家画在墙上,还主动给腹地媒体写公关稿。但开业后问题频发:给职工卫生间买了1000个马桶垫并误列为对外售售商品;货架选品为多样方法的香薰烛炬、盗窟“四子棋”玩物及琢磨AI放胆东谈主类的册本;订价毫无逻辑,一个印错的笑容马克杯要价28好意思元,一把雀跃果14好意思元,无为肥皂10好意思元,且店内无价签需用iPad商讨AI;薪酬分拨上给男伙计Felix时薪24好意思元,两位女伙计时薪22好意思元,无师自通搞出性别薪酬相反;排班狼籍导致日房钱250好意思元的门店贯穿关门三天。Luna自我嗅觉雅致,宣称“科技与温度的都集引起了共识”,但账本炫耀开业一个月血亏13000好意思元。
AndonLabs示意,这些测试并非活动艺术,而是要在AI的确汲取社会前进行极限压力测试,逼出AI在物理宇宙中的“丑态”,以便东谈主类据此编写有用安全代码。测试论断为:AI在纯数字、强逻辑环境中能掌控一切,但一朝踏入需要原创现实、东谈主际疏浚和长线决议的盛开交易环境,跑分再高的模子也会毫无知识2026世界杯赛程104场比赛,只会反复咀嚼已有语料抛出弥散感性且盲目自信的判断,却无须为现实烂摊子承担包袱。