31일차 | LLM 성능 비교 — 40대 직장인이 실무에서 체감한 AI 서열과 인재 전쟁
경제적 자유 도전기 · 31일차 매일 산더미처럼 쌓이는 회사 행정 업무 속에서 어떤 AI 도구를 써야 가장 정교하고 빠르게 일을 끝낼 수 있을지 고민해본 적이 있으신가요? 똑같은 프롬프트(요청)를 입력해도 LLM 모델마다 내놓는 결과물의 완성도가 확연히 다르다 보니, 이제 직장인에게 대형언어모델(LLM)을 선별하는 안목은 개인의 핵심 생산성이자 경쟁력이 되었습니다. 실제 직장 실무 전선에서 보고서 작성, 데이터 정리, 기획안 검토 등 다양한 행정 과제를 수행하며 체감한 LLM 모델들의 주관적이면서도 솔직한 서열을 공유합니다. 더불어 매번 왜 이런 성능 차이가 발생하는지, 그 배경에 숨겨진 실리콘밸리의 거대한 인재 이동 흐름까지 함께 정리했습니다. 실무 행정에서 체감한 LLM 성능 비교와 서열 현재 제 업무 환경을 기준으로 행정 업무 효율성 1위는 단연 클로드(Claude) 입니다. 한마디로 '알잘딱깔센(알아서 잘 딱 깔끔하고 센스 있게)'의 표본이라고 할 수 있습니다. 이미지 제작 기능이 없어 가끔 아쉬울 때도 있지만, 원본 자료나 초안 자료를 넣고 워드 문서나 엑셀 표를 작성해 달라고 하면 그야말로 고품질의 결과물을 줍니다. 그리고, 예상질문 등을 만드는 등 거친 문맥을 세련되게 다듬는 능력은 단연 독보적입니다. Pro 요금제($20)를 사용하는데, 토큰이 금새 소진되는 단점이 있어서 아껴서 써야 됩니다. 2위는 챗GPT(ChatGPT) 입니다. 글을 다듬는 솜씨나 Dall-E 기반의 이미지 생성 역량 측면에서 제미나이보다 한 수 위의 범용성을 보여줍니다. 또한, 근래 이미지 제작이 크게 향상되면서 내용을 넣고 ppt용 이미지를 만들어 달라고 하면 ppt 전문가 수준으로 제작해 줍니다. 또한, 영어학습을 위해 챗GPT와의 프리토킹은 효과적입니다. Plus 요금제 ($20) 사용중인데, 토큰도 오래 지속되고요. 반면 3위로 밀려난 제미나이(Gemini) 는 초기에 노트북LM(NotebookLM) 연동 등으로 pp...