- 새로운 연구에 따르면 ChatGPT, Claude, Gemini, Grok, Mistral, DeepSeek와 같은 대규모 언어 모델은 기업의 구체적인 맥락을 분석하기보다는 현대 경영의 ‘유행어(buzzwords)’에 치우친 유사한 전략적 조언을 제공하는 경향이 있습니다. 연구자들은 이 현상을 ‘트렌드슬롭(trendslop)’이라고 부릅니다.
- 연구팀은 탐색 vs 활용, 중앙 집중 vs 분권화, 단기 vs 장기, 경쟁 vs 협력, 파괴적 혁신 vs 개선, 차별화 vs 범용화(commoditization), 자동화 vs 인간 증강 등 7가지 일반적인 전략적 갈등을 조사했습니다.
- 수천 번의 시뮬레이션에서 AI 모델은 지속적으로 같은 쪽을 선택했습니다. 즉, 기업의 맥락과 거의 관계없이 차별화, AI를 통한 인간 증강, 협력, 장기적 사고, 분권화를 우선시했습니다.
- GPT-5를 사용한 15,000회 이상의 테스트 결과, ‘더 나은 프롬프트’를 사용해도 편향은 거의 제거되지 않는 것으로 나타났습니다. 강력한 영향 요인 중 하나는 선택지의 순서였는데, 단순히 선택 순서를 바꾸는 것만으로도 결과가 약 19% 변할 수 있었습니다.
- 기술 스타트업, 은행, 병원 또는 비영리 단체와 같은 상세한 맥락을 제공하더라도 편향은 약 11% 감소했을 뿐 제거되지는 않았습니다.
- 원인은 학습 데이터에 있습니다. LLM은 인터넷에서 학습하는데, 인터넷에서는 ‘혁신’, ‘협력’, ‘차별화’와 같은 개념은 긍정적으로 인식되는 반면 ‘범용화’나 ‘중앙 집중화’는 구식으로 간주되는 경우가 많기 때문입니다.
- 또 다른 위험은 ‘하이브리드 함정’입니다. 허용될 경우 AI는 차별화와 비용 우위 전략을 동시에 추진하는 것과 같이 모순된 두 전략을 결합하도록 제안하곤 하는데, 이는 전통적인 전략 이론에서 기업을 ‘중간에 낀 상태(stuck in the middle)’로 만들기 쉽다고 경고하는 부분입니다.
📌 연구에 따르면 LLM은 많은 리더가 생각하는 것처럼 중립적인 전략 고문이 아닙니다. 수천 번의 테스트와 GPT-5를 통한 15,000회 이상의 시뮬레이션에서 AI는 기업의 맥락에 상관없이 차별화, 협력, 장기적 사고와 같은 ‘유행하는’ 전략을 지속적으로 권장했습니다. 이는 구체적인 상황 분석보다 현대 경영 용어에 치우쳐 유사한 전략적 조언을 내놓는 경향으로, 연구자들은 이를 ‘트렌드슬롭’이라고 정의합니다. 이는 AI가 학습한 인터넷 데이터와 현대 경영 문화에서 비롯된 것입니다. 따라서 LLM은 아이디어 생성 및 대안 분석 도구로 사용되어야 하며, 최종적인 전략 결정은 반드시 인간이 책임져야 합니다.

