하나의 기사로 빠른 잠금 해제: 라벨 시스템의 전체 프로세스
업데이트 날짜: 41-0-0 0:0:0

태깅 시스템은 비즈니스 분석, 사용자 초상화, 추천 전략 및 기타 측면과 관련된 데이터 분석의 핵심입니다. 정확하고 효율적인 라벨링 시스템은 후속 분석을 위해 풍부한 재료와 경험 축적을 제공할 수 있습니다. 이 기사에서는 라벨링 시스템을 구축할 때 흔히 저지르는 실수를 피하는 방법을 공유하고 라벨링 시스템을 구축하고 최적화하기 위한 체계적인 접근 방식을 제공합니다.

라벨링 시스템은 확실히 데이터 분석 작업에서 가장 우선 순위가 높습니다. 모든 작업, 비즈니스 분석, 배치 분석, 사용자 초상화, 추천 전략, 제품 운영 ...... 관련이 있기 때문에 이 모든 것은 레이블에 의해 주도됩니다.

라벨링 시스템이 잘 수행되면 경험을 축적하기 위해 후속 분석을 위한 충분한 재료가 있을 것입니다. 라벨링 시스템은 낭비되는 노력은 말할 것도 없고 제대로 수행되지 않았으며 나중에 심층 분석을 수행할 때 의존하지 않았습니다.

그렇다면 어떻게 해야 할까요? 오늘은 간략하게 공유해 보겠습니다.

1. 라벨링 시스템의 일반적인 실수

가장 흔한 실수는 라벨이 당신이 넣은 모든 것의 바구니일 뿐이라는 것입니다.

  • 기사를 업로드할 때 뉴스, 핫스팟, 제품 ...... 몇 가지를 게시하십시오.
  • 제품이 선반에 있을 때 기능, 포장, 가격 등 몇 가지를 손에 넣으십시오......
  • 이벤트가 공개되면 이름, 선물, 할인 등 몇 가지를 게시하세요......

물론, 유저를 태그할 때 '높은 가치', '잠재력', 'XX호쾌한'은 아무렇지도 않게 붙여넣는다. 비슷한 이름을 가진 "높은 가치", "높은 품질" 및 "고품질"도 동시에 존재합니다.

이러한 단점은 사용자 초상화 프로젝트에서 작업할 때 모든 곳에서 볼 수 있습니다. 사람들은 종종 저에게 자랑스럽게 "첸 씨, 우리는 너무 잘해요, ...... 사용자 태그가 3000개 이상입니다"라고 자랑스러워합니다.

이때 그에게 물어보기만 하면 됩니다.

3000 태그, 비즈니스용은 몇 개입니까?

3000 태그, 얼마나 많은 가치가 생성됩니까?

Ya는 낙담하고 한 문장을 떨어뜨렸습니다 : 나는 여전히 그것을 적용하는 방법을 탐구하고 있습니다...... 그리고 도망쳤다.

왜? 이러한 태그는 데이터베이스에있는 차원의 묶음이기 때문입니다. 비즈니스를 사용하려면 먼저 생각해야 합니다: 비즈니스의 요구 사항은 무엇인지, 왜 레이블을 사용해야 하는지.

둘째, 상황을 타개려면 필요를 이해하는 것부터 시작해야 합니다

라벨을 만들 때 완전히 다른 요구 사항의 클래스가 3개 이상 있습니다.

1. 관리

가치에 대한 필요성을 빠르게 파악합니다. 경영진은 수백 페이지의 PPT 보고서를 보는 것을 가장 두려워합니다. 라벨은 비즈니스의 의미를 효과적으로 추출하고 가장 중요한 요소를 식별할 수 있습니다.

예를 들면:

  • 사용자를 표시하고 ABC 사용자를 구분합니다.
  • 안정적인 채널과 불안정한 채널을 구분하기 위해 채널에 레이블을 지정합니다.
  • 제품을 표시하여 수명 주기 전/중/후를 구분하십시오.

이런 식으로 성능이 변동할 때 경영진은 한 눈에 '아, XX place의 문제구나' 할 수 있습니다. 많은 시간을 절약할 수 있습니다.

2. 운영

계획하기 위해 영감을 받는 데 필요한 것을 찾으십시오. 운영 부서는 다음과 같은 질문을 가장 좋아합니다.

  • 사용자는 무엇을 좋아합니까?
  • 사용자는 어디에 있습니까?
  • 사용자가 구매할까요?
  • 사지 않으면 쿠폰 뱅크를 보낼 수 있습니까?
  • 쿠폰은 사용할 수 없지만 선물은 줄 수 없습니까?

최종 분석에서 이러한 문제는 "계획의 5 요소"를 중심으로 진행되며, 아래 그림과 같이 (희소 데이터가 아닌) 레이블을 통해 비즈니스 질문에 대한 답을 명확하게 말할 수 있으면 좋을 것입니다.

3. 일선 근로자

질문에 대한 명확한 답변의 필요성. 일선 작업자는 수천 마일 떨어진 곳에 있는 데이터 분석가보다 고객 행동과 요구 사항을 훨씬 더 잘 알고 있습니다.

일선 직원들에게 필요한 것은 당신이 나에게 그것을 하는 방법을 가르쳐 주는 것이 아닙니다(그리고 나는 그것을 가르칠 수 없습니다). 하지만:

  • 고객이 저를 찾아오면 저는 그 질문에 명확하게 대답할 수 있습니다
  • 본부에서 확인하러 왔을 때, 저는 숙제를 정확하게 제출할 수 있었습니다
  • 합리적인 판매 기회가 있을 때 적합한 도구를 찾을 수 있습니다

예를 들면:

고객이 제품에 대해 상담할 때 정보를 빠르게 찾을 수 있습니다

인센티브 정책을 사용하면 내가 얼마나 달성했는지 빠르게 확인할 수 있습니다

이벤트가 진행 중인데 어떤 게스트가 참여할 수 있는지 빠르게 알 수 있습니다

이러한 명확한 지침이 가장 좋은 도구입니다.

비즈니스 요구 사항을 주의 깊게 이해한 후에는 대규모 라벨링이 필요하지 않다는 것을 알게 될 것입니다. 비즈니스를 위해 넓은 영역의 라벨을 사용할 필요는 없습니다! 프로젝트 성공의 핵심은 더 적지만 더 정확한 라벨을 제공하고, 비즈니스 사용 습관을 기르고, 점진적으로 완전한 시스템을 구축하는 것입니다.

그렇다면 어디서부터 시작해야 할까요?

3. 가장 간단한 것부터 정렬

위의 세 가지 유형의 요구 사항을 구현하는 어려움은 다릅니다.

가장 쉽게 달성할 수 있는 것은 일선 인력이 필요하다는 것입니다. 이론적으로, 일선에서 자주 쿼리되는 활동, 상품 및 기사가 표준 형식에 따라 레이블이 지정되고 라이브러리에 저장되는 한(아래 그림 참조).

하지만! 이것은 일선의 요구를 충족시키지 못합니다. 일선에서 정보를 찾는 것은 본질적으로 어렵기 때문입니다. 예를 들어, 이번 달에 동시에 시작된 활동이 30 개 있고, 가장 인기있는 활동 중 일선에 관심이있는 활동이 두세 개 있을 수 있습니다. 그리고 가장 인기 있는 두세 가지, 즉 일선 직원과 고객은 종종 그들에게 별명을 붙여주어 기괴한 검색 키워드를 만듭니다. 태그 라이브러리 쿼리를 직접 열면 사용률이 낮고 검색 정확도가 낮은 경우가 많습니다.

따라서 일선에 제공되는 도구를 더욱 최적화할 수 있습니다.

  • 1차 의견을 적극적으로 수집하고 키워드 검색을 최적화합니다.
  • 일반적으로 사용되는 인기 태그는 이해하기 위해 적극적으로 일선에 푸시됩니다.
  • 판매 보조원과 같은 도구는 주요 태그를 강조 표시하도록 최적화되어 있습니다

이러한 방식으로 라벨 사용 빈도를 높일 수 있으며 일선 효율성을 높일 수 있는 기회가 있습니다.

넷째, 분류, 식별의 가장 중요한 가치

푸시하기 쉬운 두 번째 유형은 값을 식별하는 레이블입니다.

첫째, 가치의 정의는 비교적 간단하고 명확하며 쉽게 수행할 수 있습니다.

둘째, 가치태그의 관리는 종종 그것을 보고 존재감을 닦을 수 있습니다.

셋째, 일일 진단 지표의 변동을 사용할 수 있으며 출현율이 높습니다.

다른 일을 하지 않더라도 이러한 표지판의 가치를 우선시해야 합니다.

일반적인 것은 다음과 같습니다.

  • 제품 가치 태그: 폭발 모델, 배수 모델, 수익 모델, 일치하는 모델 및 방어 모델
  • 파이프라인 값 태그: 과거 입력-출력 비율, 출력량 + 안정성
  • 사용자 가치 태그: 생성된 소비량 + 예상 미래 소비량

(아래 그림 참조)

  • 원가와 가격이 계산되는 한 상품의 가치는 명확하게 계산할 수 있으며 가장 간단합니다.
  • 파이프라인의 값은 채널의 입력과 출력이 계산되고 과거 추세가 관찰되는 한 명확하게 볼 수 있습니다
  • 직접 계산된 사용자 값은 예상 출력일 수 있으며, 여기에는 약간의 워크로드가 필요합니다

(아래 그림 참조)

여기서 유일한 과제는 경영에서 이 개념을 대중화하는 것입니다. 그 회사는 이전에 비슷한 라벨을 한 적이 없을 가능성이 매우 높고, "무엇이 고가치 사용자인가" "무엇이 고품질 채널인가"에 대한 경영진 내부의 합의가 이루어지지 않고 있기 때문에, 처음으로 언급하는 것은 어려울 수 있습니다. 그러나 자체 제품, 채널 및 사용자가 어떻게 생겼는지조차 모를 정도로 무지하지 않은 한 점차 라벨 적용을 촉진할 수 있습니다. 결국, 보고서를 읽어야 하는 부담을 줄이고 핵심 문제에 집중하는 것이 모든 사람의 공통된 매력입니다.

다섯째, 탐색하고 점진적으로 정확성을 달성합니다.

세 가지 유형의 요구 사항 중 가장 충족하기 어려운 요구 사항은 운영 부서의 요구 사항입니다. "좋아요"와 "선호 사항"태그는 만들기가 매우 어렵습니다.

  • 數據少:不是頭騰阿,採集不到足夠用戶決策路徑
  • 정의하기 어렵다 : 좋아한다는 것은 무엇을 의미합니까? 구매는 취향으로 간주됩니까? 보기만 하고 사지 않아도 계산되나요?
  • 불안정 : 나는 그것을 좋아하지 않았지만 당신이 가격을 낮추자마자 그는 그것을 좋아했습니다......
  • 결과를 보기 어려움: 그는 그것을 좋아하지만 프로모션 채널에서 고객에게 연락할 수 없습니다......

말할 것도 없이, 효과가 있다 하더라도 광고 문구, 판촉 제안 및 사용자 요구의 어느 정도가 고려될까요......

따라서 이 작업을 명확하게 수행하려면 여러 번 반복해야 합니다.

반복의 방법은 더 많은 데이터에서 더 적은 데이터로 이동하는 것입니다. 예를 들면:

  • 프로모션의 관점에서는 울을 가장 좋아하는 사람들이 먼저 분류됩니다
  • 소비의 관점에서는 가장 자주 재구매하는 사람들을 먼저 연구해야 합니다
  • 행동의 관점에서, 가장 자주 상호 작용하는 사람들을 먼저 이해해야 한다

이러한 극단적인 그룹은 일반적으로 성능에 큰 영향을 미치며 데이터가 많기 때문에 규칙을 쉽게 요약할 수 있습니다. 그리고 높은 소비가 소비되지 않고 높은 활동이 전환되지 않을 때 비즈니스 부서는 방법을 찾기 위해 서두르게 될 것이며 비즈니스 조치와 함께 예측의 정확성을 더욱 검증할 수 있습니다.

데이터가 거의 없는 사용자의 경우 먼저 고정된 권장 경로(아래 그림 참조)에 따라 생선을 튀기고 비즈니스 작업과 결합하여 사용자 요구 사항을 테스트하고 예측의 정확도를 점진적으로 향상시킬 수 있습니다.

VI. 샤오위

라벨링은 매우 중요하며, 정성적 요인을 정량화하고 가치 판단을 제공하는 중요한 도구이며, 매우 기본적인 구성입니다. 그러나 라벨 프로젝트를 수행하려면 비즈니스 분석(관리), 활동 지원(운영), 시스템 도구(일선용)와 결합되어야 하며 무명에 전념할 수 없습니다. 그렇지 않으면 다들 희미한 목소리로 비약의 용광로를 정제할 수 있다고 생각하고, 그 과정에 참여하지 않고 사용하지 않으면 마지막에 분명 실망하게 될 것입니다.

이 기사는 오퍼레이션 파벌 [Down-to-earth Teacher Chen]의 저자, WeChat 공개 계정: [Down-to-earth Teacher Chen], 원본/승인 오퍼레이션 스쿨에 게시되었으며 허가 없이 전재를 금지합니다.

제목 이미지는 Unsplash에서 가져온 것이며 CC0에 따라 사용이 허가되었습니다.