태깅 시스템은 비즈니스 분석, 사용자 초상화, 추천 전략 및 기타 측면과 관련된 데이터 분석의 핵심입니다. 정확하고 효율적인 라벨링 시스템은 후속 분석을 위해 풍부한 재료와 경험 축적을 제공할 수 있습니다. 이 기사에서는 라벨링 시스템을 구축할 때 흔히 저지르는 실수를 피하는 방법을 공유하고 라벨링 시스템을 구축하고 최적화하기 위한 체계적인 접근 방식을 제공합니다.
라벨링 시스템은 확실히 데이터 분석 작업에서 가장 우선 순위가 높습니다. 모든 작업, 비즈니스 분석, 배치 분석, 사용자 초상화, 추천 전략, 제품 운영 ...... 관련이 있기 때문에 이 모든 것은 레이블에 의해 주도됩니다.
라벨링 시스템이 잘 수행되면 경험을 축적하기 위해 후속 분석을 위한 충분한 재료가 있을 것입니다. 라벨링 시스템은 낭비되는 노력은 말할 것도 없고 제대로 수행되지 않았으며 나중에 심층 분석을 수행할 때 의존하지 않았습니다.
그렇다면 어떻게 해야 할까요? 오늘은 간략하게 공유해 보겠습니다.
가장 흔한 실수는 라벨이 당신이 넣은 모든 것의 바구니일 뿐이라는 것입니다.
물론, 유저를 태그할 때 '높은 가치', '잠재력', 'XX호쾌한'은 아무렇지도 않게 붙여넣는다. 비슷한 이름을 가진 "높은 가치", "높은 품질" 및 "고품질"도 동시에 존재합니다.
이러한 단점은 사용자 초상화 프로젝트에서 작업할 때 모든 곳에서 볼 수 있습니다. 사람들은 종종 저에게 자랑스럽게 "첸 씨, 우리는 너무 잘해요, ...... 사용자 태그가 3000개 이상입니다"라고 자랑스러워합니다.
이때 그에게 물어보기만 하면 됩니다.
3000 태그, 비즈니스용은 몇 개입니까?
3000 태그, 얼마나 많은 가치가 생성됩니까?
Ya는 낙담하고 한 문장을 떨어뜨렸습니다 : 나는 여전히 그것을 적용하는 방법을 탐구하고 있습니다...... 그리고 도망쳤다.
왜? 이러한 태그는 데이터베이스에있는 차원의 묶음이기 때문입니다. 비즈니스를 사용하려면 먼저 생각해야 합니다: 비즈니스의 요구 사항은 무엇인지, 왜 레이블을 사용해야 하는지.
라벨을 만들 때 완전히 다른 요구 사항의 클래스가 3개 이상 있습니다.
가치에 대한 필요성을 빠르게 파악합니다. 경영진은 수백 페이지의 PPT 보고서를 보는 것을 가장 두려워합니다. 라벨은 비즈니스의 의미를 효과적으로 추출하고 가장 중요한 요소를 식별할 수 있습니다.
예를 들면:
이런 식으로 성능이 변동할 때 경영진은 한 눈에 '아, XX place의 문제구나' 할 수 있습니다. 많은 시간을 절약할 수 있습니다.
계획하기 위해 영감을 받는 데 필요한 것을 찾으십시오. 운영 부서는 다음과 같은 질문을 가장 좋아합니다.
최종 분석에서 이러한 문제는 "계획의 5 요소"를 중심으로 진행되며, 아래 그림과 같이 (희소 데이터가 아닌) 레이블을 통해 비즈니스 질문에 대한 답을 명확하게 말할 수 있으면 좋을 것입니다.
질문에 대한 명확한 답변의 필요성. 일선 작업자는 수천 마일 떨어진 곳에 있는 데이터 분석가보다 고객 행동과 요구 사항을 훨씬 더 잘 알고 있습니다.
일선 직원들에게 필요한 것은 당신이 나에게 그것을 하는 방법을 가르쳐 주는 것이 아닙니다(그리고 나는 그것을 가르칠 수 없습니다). 하지만:
예를 들면:
고객이 제품에 대해 상담할 때 정보를 빠르게 찾을 수 있습니다
인센티브 정책을 사용하면 내가 얼마나 달성했는지 빠르게 확인할 수 있습니다
이벤트가 진행 중인데 어떤 게스트가 참여할 수 있는지 빠르게 알 수 있습니다
이러한 명확한 지침이 가장 좋은 도구입니다.
비즈니스 요구 사항을 주의 깊게 이해한 후에는 대규모 라벨링이 필요하지 않다는 것을 알게 될 것입니다. 비즈니스를 위해 넓은 영역의 라벨을 사용할 필요는 없습니다! 프로젝트 성공의 핵심은 더 적지만 더 정확한 라벨을 제공하고, 비즈니스 사용 습관을 기르고, 점진적으로 완전한 시스템을 구축하는 것입니다.
그렇다면 어디서부터 시작해야 할까요?
위의 세 가지 유형의 요구 사항을 구현하는 어려움은 다릅니다.
가장 쉽게 달성할 수 있는 것은 일선 인력이 필요하다는 것입니다. 이론적으로, 일선에서 자주 쿼리되는 활동, 상품 및 기사가 표준 형식에 따라 레이블이 지정되고 라이브러리에 저장되는 한(아래 그림 참조).
하지만! 이것은 일선의 요구를 충족시키지 못합니다. 일선에서 정보를 찾는 것은 본질적으로 어렵기 때문입니다. 예를 들어, 이번 달에 동시에 시작된 활동이 30 개 있고, 가장 인기있는 활동 중 일선에 관심이있는 활동이 두세 개 있을 수 있습니다. 그리고 가장 인기 있는 두세 가지, 즉 일선 직원과 고객은 종종 그들에게 별명을 붙여주어 기괴한 검색 키워드를 만듭니다. 태그 라이브러리 쿼리를 직접 열면 사용률이 낮고 검색 정확도가 낮은 경우가 많습니다.
따라서 일선에 제공되는 도구를 더욱 최적화할 수 있습니다.
이러한 방식으로 라벨 사용 빈도를 높일 수 있으며 일선 효율성을 높일 수 있는 기회가 있습니다.
푸시하기 쉬운 두 번째 유형은 값을 식별하는 레이블입니다.
첫째, 가치의 정의는 비교적 간단하고 명확하며 쉽게 수행할 수 있습니다.
둘째, 가치태그의 관리는 종종 그것을 보고 존재감을 닦을 수 있습니다.
셋째, 일일 진단 지표의 변동을 사용할 수 있으며 출현율이 높습니다.
다른 일을 하지 않더라도 이러한 표지판의 가치를 우선시해야 합니다.
일반적인 것은 다음과 같습니다.
(아래 그림 참조)
(아래 그림 참조)
여기서 유일한 과제는 경영에서 이 개념을 대중화하는 것입니다. 그 회사는 이전에 비슷한 라벨을 한 적이 없을 가능성이 매우 높고, "무엇이 고가치 사용자인가" "무엇이 고품질 채널인가"에 대한 경영진 내부의 합의가 이루어지지 않고 있기 때문에, 처음으로 언급하는 것은 어려울 수 있습니다. 그러나 자체 제품, 채널 및 사용자가 어떻게 생겼는지조차 모를 정도로 무지하지 않은 한 점차 라벨 적용을 촉진할 수 있습니다. 결국, 보고서를 읽어야 하는 부담을 줄이고 핵심 문제에 집중하는 것이 모든 사람의 공통된 매력입니다.
세 가지 유형의 요구 사항 중 가장 충족하기 어려운 요구 사항은 운영 부서의 요구 사항입니다. "좋아요"와 "선호 사항"태그는 만들기가 매우 어렵습니다.
말할 것도 없이, 효과가 있다 하더라도 광고 문구, 판촉 제안 및 사용자 요구의 어느 정도가 고려될까요......
따라서 이 작업을 명확하게 수행하려면 여러 번 반복해야 합니다.
반복의 방법은 더 많은 데이터에서 더 적은 데이터로 이동하는 것입니다. 예를 들면:
이러한 극단적인 그룹은 일반적으로 성능에 큰 영향을 미치며 데이터가 많기 때문에 규칙을 쉽게 요약할 수 있습니다. 그리고 높은 소비가 소비되지 않고 높은 활동이 전환되지 않을 때 비즈니스 부서는 방법을 찾기 위해 서두르게 될 것이며 비즈니스 조치와 함께 예측의 정확성을 더욱 검증할 수 있습니다.
데이터가 거의 없는 사용자의 경우 먼저 고정된 권장 경로(아래 그림 참조)에 따라 생선을 튀기고 비즈니스 작업과 결합하여 사용자 요구 사항을 테스트하고 예측의 정확도를 점진적으로 향상시킬 수 있습니다.
라벨링은 매우 중요하며, 정성적 요인을 정량화하고 가치 판단을 제공하는 중요한 도구이며, 매우 기본적인 구성입니다. 그러나 라벨 프로젝트를 수행하려면 비즈니스 분석(관리), 활동 지원(운영), 시스템 도구(일선용)와 결합되어야 하며 무명에 전념할 수 없습니다. 그렇지 않으면 다들 희미한 목소리로 비약의 용광로를 정제할 수 있다고 생각하고, 그 과정에 참여하지 않고 사용하지 않으면 마지막에 분명 실망하게 될 것입니다.
이 기사는 오퍼레이션 파벌 [Down-to-earth Teacher Chen]의 저자, WeChat 공개 계정: [Down-to-earth Teacher Chen], 원본/승인 오퍼레이션 스쿨에 게시되었으며 허가 없이 전재를 금지합니다.
제목 이미지는 Unsplash에서 가져온 것이며 CC0에 따라 사용이 허가되었습니다.