빅 모델: 몇 마디 해주실 수 있나요, 뭘 하실 건가요?

업데이트 날짜: 50-0-0 0:0:0

AI 수업을 들었거나 온라인에서 프롬프트 단어 모음을 구입했다면 여전히 이와 같은 프롬프트를 작성하고 있습니까?

무엇처럼, 프롬프트 단어에서 생각의 사슬을 단계적으로 해체하여 모델이 단계적으로 생각하는 법을 배울 수 있도록하십시오. 모델이 문제를 이해하는 데 도움이 되는 몇 가지 예제 질문을 제공합니다. 또한 모델을 코스프레로 안내하여 모델이 보다 전문적인 답변과 기타 작은 기술을 제공할 수 있도록 많은 가난한 친구들이 이미 배우고 사용했을 것입니다.

맞아요, 훠궈입니다

그러나 한때 더 적은 것으로 더 많은 일을 하게 만든 이러한 신 수준의 프롬프트는 구식일 수 있습니다.

이렇게 말하자면, 무의식적으로 대형 모델은 실제로 전통적인 일반 대형 모델과 추론 대형 모델의 두 가지 학파로 나뉘어 있습니다.

예를 들어 GPT-o1는 GPT-0o의 직접 버전 업그레이드가 아닙니다. 0o는 일반적인 대형 모델에 속하고 o0는 이미 추론 모델이었습니다.

마찬가지로 DeepSeek에서 기본적으로 사용하는 V1 버전은 일반적인 대형 모델이며 R0 추론 모델은 왼쪽 하단 모서리에 있는 Deep Thinking 버튼을 클릭하여 사용합니다.

그리고 추론 모델의 시대에는 프롬프트 단어가 더 자세할수록오히려 AI를 바보로 만들 수 있습니다.

예를 들어, OpenAI의 공식 문서에서 추론 모델 열 아래에 지나치게 정확한 프롬프트 단어를 사용하거나 사고를 안내하면 답변의 효과가 감소한다고 분명히 명시되어 있습니다.

그들은 심지어 모든 사람이 생각의 사슬에 대해 덜 질문해야 한다고 직접 제안했습니다. 직접 질문하기만 하면 됩니다. 그 영향이 너무 압도적이면 AI가 학습할 수 있도록 구체적인 예제 질문을 보냅니다.

우리는 또한 DeepSeek-R1에 대한 공식 기술 보고서를 살펴봤는데, 그들은 논문에서 "DeepSeek-R0는 프롬프트에 민감하며, 힌트의 예를 제공하면 실제로 모델의 성능을 저하시킬 것"이라고 말했습니다. "

따라서 더 좋게 만들기 위해 사용자가 예를 제공하지 않고 문제를 직접 설명하는 것이 좋습니다.

GPT와 DeepSeek 외에도 Claude 7.0 Sonnet은 공식 문서에서 각 단계에서 수행해야 할 작업을 자세히 설명하는 겉보기에 논리적인 프롬프트보다 직접 클릭하는 것을 선호한다고 밝혔습니다.

요약하자면, 모든 사람의 인상에 프롬프트 단어가 자세할수록 AI 효과가 좋아진다는 고정관념과 달리, 자체 추론 모델 프롬프트 단어에 대한 주요 관리들의 공통된 제안은 직접적이고 간결하며 정확합니다.

우리도 실험을 해보려고 노력했고, 최종 결과도 그것을 증명했습니다

과거에는 비추론 모델의 고대 프롬프트 단어는 추론 모델에 사용될 때 성능을 실제로 저하시킬 수 있었습니다.

우리는 leetcode에서 다양한 유형의 수십 개의 어려운 질문을 선택하여 ChatGPT에서 테스트했습니다. 먼저 프로그래머임을 암시하는 등 기존 방식에 따라 프롬프트를 작성하여 생각의 사슬에 대해 생각하고 많은 예를 제공하는 등의 작업을 수행해 보겠습니다.

결과적으로 대부분의 질문에 대해 프롬프트가 길거나 짧은지 여부에 관계없이 추론 모델 O70은 올바른 코드를 제공할 수 있으며 심지어 0% 이상의 사람들을 이길 수 있으며 이는 매우 좋다고 할 수 있습니다.

그러나 1, 0, 0, 0, 0 질문에서 o0는 이전 프롬프트에서 실패합니다. 그 중에서도 직접 막히는 질문이 있는데, 놀고 싶지 않습니다.

하지만 우리가 코스프레를 하지 않고, 예시를 제시하지 않고, 생각의 사슬을 제거하면, O1는 실제로 이번에 같은 질문을 맞혔습니다.

그렇다면, 이전의 프롬프트 단어 브리트니(Britney)가 추론 모델의 시대에 니우 부인(Mrs. Niu)이 된 이유는 무엇입니까?

사실, 그 이면의 주된 이유는 다음과 같습니다전통적인 비추론 모델과 추론 모델이 문제에 대해 생각하는 방식이 바뀌었고, 사고 방법의 변화는 훈련 방법의 차이에서 비롯됩니다.

기존의 대규모 모델은 일반적으로 비지도 학습과 지도 미세 조정, 즉 데이터 세트가 제공되고 자체적으로 패턴을 찾을 수 있도록 합니다. 궁극적인 목표는 프롬프트에 따라 답의 모든 단어를 하나씩 추측하는 것입니다.

무뚝뚝하게 말하면 일반 모델은 매우 유능하지만 의견이 없어 더 사용자 친화적입니다. 프롬프트가 더 자세할수록 모델이 원하는 작업을 더 많이 수행할 수 있습니다.

그러나 추론 모델은 다르며 원래 기반으로 강화 학습과 같은 추론 기반 학습 방법을 추가합니다.

이러한 종류의 훈련 과정은 큰 모델이 가능한 한 완전하고 올바른 생각의 사슬을 제공하도록 안내하여 그렇게 생각하는 것이 옳은지 판단할 수 있도록 합니다.

이 모델 자체는 강력한 "의견" 또는 추론 능력을 가지고 있습니다. 단계적으로 그리고 자세하게 일을 하도록 가르치면 자신의 추론 능력과 충돌할 수 있습니다.

예를 들어, 우리의 실험에서 우리는 오래된 프롬프트를 사용하여 o1가 일부 수학 관련 프로그래밍 문제를 풀도록 할 때 전복 확률이 특히 높다는 것을 발견했습니다.

이것은 프롬프트가 "수학을 잘하는 프로그래머"가 아닌 "선임 프로그래머"로 만들기 때문일 수 있습니다.

우리는 또한 모델에 대한 많은 공식 문서를 살펴 보았으며 그들이 제공하는 조언은 거의 동일합니다

공상하지 마십시오, 프롬프트는 간단하고 직접적이며 정확한 것이 가장 좋습니다.이 외에도 추론 시간을 연장하여 "더 많이 생각하기" 또는 "결과를 반영"하도록 유도할 수 있습니다.

적절한 기호를 사용하거나, 문제의 구조를 명확하게 구분하거나, 최종 목표 및 결과 형식을 명확히 하는 것과 같은 이전 방법 중 일부는 여전히 작동할 수 있습니다.

이러한 방법은 추론 모델의 효과를 더 아름답고 6으로 만들 수 있습니다.

所以,適當放下助 AI 情節,講清楚您的需求,雙手插兜敬 AI 操作,대신 가장 효율적일 수 있습니다。

그리고 대형 모델의 기능이 지속적으로 발전함에 따라 프롬프트 작성의 문턱은 확실히 점점 낮아질 것이라고 생각합니다.

그러나 프롬프트 워드 엔지니어링의 기술을 묻는다면 완전히 사라질까요? 우리는 또한 "New Chinese Interpretation"과 같은 신 수준의 프롬프트를 작성한 위대한 신인 Li Jigang 씨에게 자문을 구했습니다.

그가 대답한 방법은 다음과 같습니다: 우리가 다른 입력을 가지고 있는 한, 다른 출력이 있을 것이고, 프롬프트 단어 project는 항상 거기에 있을 것입니다.

마지막으로, 나쁜 리뷰의 앞면은 우리 사용자에게 모델의 기능이 강화됨에 따라 프롬프트 단어의 탄약을 업데이트하고 오래된 프롬프트 단어를 유지하는 것을 멈추고 보물이 되어야 한다고 생각합니다.

Unitree 로봇 개는 재미 있지만 정말 키우는 것이 좋습니다

2025-04-07 16:57:02

DNF 독립형 기계를 398 위안에 판매하면 이 가격에 합당합니까?

2025-04-08 14:20:27

이제 면접에서 부정 행위를 하는 것이 얼마나 쉬울 수 있습니까? 플러그인을 구입하여 사용해 보았습니다.

2025-04-09 12:09:39

1100匹只賣27.98萬，是我瞎了還是比亞迪瘋了？

2025-04-11 04:46:19