더 좋은 데이터로 더 나은 AI를 만들기 위해 여러분의 도움이 필요합니다
TL;DR
AI는 지난 몇 년에 걸쳐 눈부시게 발전했지만 전문 개발자들에게 필요한 기능을 모두 제공하지는 못합니다. 대부분의 모델이 공개된 데이터세트를 기반으로 학습되지만, 이러한 데이터세트는 전문 개발자들이 매일 직면하는 복잡한 실제 상황을 반영하지 못하기 때문입니다. 실무적 데이터 없이는 AI 도구가 더 완벽해질 수 없습니다. 이를 개선하기 위해 업계의 다른 기업과 마찬가지로 JetBrains도 실제 사용 사례를 학습의 기초로 삼아야 합니다.
이에 사용자 여러분께 도움을 요청드리고자 합니다. 구체적인 방법은 다음과 같습니다.
- 회사: 관리자가 회사 차원에서 데이터 공유를 활성화할 수 있습니다. 얼리 어답터를 지원하기 위해 이 프로그램이 진행되는 동안 참여하는 조직에게 한정 수량으로 All Products Pack 무료 구독을 제공합니다. 프로그램 참여를 원하지 않더라도 달라지는 것은 없으며 관리자가 데이터에 대한 결정권을 갖습니다.
- 비상업적 라이선스를 이용하는 개인: 데이터 공유가 기본적으로 활성화되어 있지만 언제든지 설정 메뉴에서 해제할 수 있습니다.
- 상업용 라이선스, 무료 평가판, 무료 커뮤니티 라이선스 또는 EAP 빌드를 이용하는 개인: 달라지는 것이 없습니다. JetBrains와 데이터를 공유하려는 의사가 있으면 설정에서 활성화할 수 있습니다.
AI는 소프트웨어 개발 방식을 바꾸고 있지만 아직 하나의 도구에 불과합니다
지난 25년 동안 JetBrains는 개발의 즐거움을 높이면서 아이디어를 코드로 바꾸는 데 활용할 수 있는 전문 개발 도구를 개발해 왔습니다. 이러한 맥락에서 AI는 혁신적인 도구라고 생각합니다. AI는 놀라운 속도로 발전하고 있지만 아직 개선의 여지가 분명히 있습니다. 현재 AI는 이미 많은 과제를 해결하고 있으며 단순하고 잘 정리된 과제의 경우 인상적인 결과를 보여줍니다. 하지만 전문 개발 환경에서 흔히 있는 복잡한 상황에서는 결과물의 품질이 급격히 저하되어 오류, 로직 결여, 심지어 존재하지 않는 허구의 코드까지 발생시킵니다.
AI를 더 효과적으로 만들려면 입력 데이터와 피드백 신호가 필수적입니다
모든 AI 계층은 학습시키고 설계하고 개선할 수 있으며, AI의 결과물은 입력 데이터와 피드백 신호의 품질에 달려 있습니다. 현재, 대부분의 LLM은 공개적으로 이용할 수 있는 동일한 데이터세트로 학습되며, 사용자로부터 실무적인 폐쇄 루프 피드백을 받아 모델 성능을 개선하는 작업은 대기업을 중심으로 이제 막 시작되었습니다. 결과는 어떨까요? AI 도구는 단순한 과제와 초기 프로젝트에서 훌륭한 결과를 보여주지만 실질적 문제는 해결하지 못하고 기존 코드베이스에 맞게 적절히 조율되지 않습니다. LLM 공급자도 이러한 문제를 인지하고 데이터 수집에 대한 접근 방식을 개선하기 시작했습니다.
기본적으로 답은 가까이에 있습니다. JetBrains IDE는 수백만 명의 전문 개발자들이 지루하고 반복적인 작업부터 최고 수준의 엔지니어링 문제에 이르기까지 다양한 일상 업무를 해결할 수 있도록 도와줍니다. 모델을 개선할 수 있는 열쇠는 정확히 데이터에 있습니다. 하지만 모두가 알고 있듯이 이는 민감한 문제입니다. 사용자의 솔루션은 지적 재산이고 코드에 비즈니스 전체가 담겨 있는 경우도 많기 때문에 어떤 정보는 비공개로 유지되어야 합니다.
실제 데이터로 AI 결과를 개선할 수 있다는 아이디어를 입증하기 위해 최근 JetBrains는 사내에서 이러한 데이터를 수집하여 모델 학습에 적용하는 프로젝트를 시작했습니다. 결과는 지금까지 성공적이었지만 다음 단계로 나아가려면 사용하는 데이터의 양과 다양성을 늘려야 합니다.
당사는 개인 및 회사의 개인정보 처리방침을 존중하며 이러한 데이터 수집에 대한 동의를 투명하게 요청합니다. 데이터 공유 결정은 언제나 여러분의 선택입니다. 어떤 의무도 없습니다. 도움을 주기로 결정하시는 경우, 공유된 모든 데이터는 EU 데이터 보호 기준을 완벽하게 준수하여 철저하게 관리될 것입니다. 참여를 결정해 주시면 JetBrains가 AI 도구를 더 스마트하고 안전하며 유용하게 만들어 전체 개발자 커뮤니티에 혜택을 제공할 수 있습니다. 협조해 주신다면 진심으로 감사드리겠습니다.
데이터 공유를 통한 향후 개선 사항
데이터를 공유함으로써, 여러분은 자신이 매일 사용하는 도구들을 개선하는 데 직접 기여하게 됩니다. 공유된 데이터는 JetBrains가 다음 내용을 보장하는데 도움이 될 것입니다.
- 안전하지 않은 코드를 탐지하고 배제하여 코드베이스에 유입될 가능성을 줄입니다. 점차 많은 팀이 장시간 실행되는 작업을 코딩 에이전트에 맡기고 있지만 아직 강력한 보안과 테스트 절차가 마련되어 있지 않은 상황에서는 이 문제가 특히 중요합니다.
- 기초 모델만 사용해야 가능한 저렴한 비용으로 낮은 인텔리전스가 필요한 대량의 작업을 처리할 수 있습니다.
- 더 스마트한 코드 완성, 더 명확한 설명, 위양성의 감소, 그리고 코드 품질이 일관되지 않을 수 있는 웹상의 과대 포장된 언어로 만들어진 인위적 예시가 아닌, 전문적인 워크플로를 실제로 이해하는 AI의 이점을 누릴 수 있습니다. JetBrains는 현직 개발자를 위해 이를 개발하고 있으며, 여러분의 실제 사용 사례가 큰 차이를 만들어냅니다.
또한, 여러분의 성원에 보답하기 위해 노력하고 있습니다. 예를 들어, 코드 완성에 특화되어 설계된 LLM인 Mellum은 오픈 소스이고 Hugging Face와 Amazon Bedrock에서 제공됩니다.
두 가지 데이터
- 현재 JetBrains 제품은 기능 사용 현황에 대한 일반적 익명 통계인 익명의 원격 측정 데이터(사용 시간, 클릭 수 또는 일반 워크플로 등)를 수집합니다.
- 여기에 편집 기록, 터미널 사용 현황, AI 기능과의 상호 작용 등 IDE 활동에 대한 세부적 코드 관련 데이터를 수집할 수 있는 옵션이 새롭게 추가되었습니다. 이러한 데이터에는 코드 스니펫, 프롬프트 텍스트, AI 응답이 포함될 수 있습니다.
많은 양의 데이터를 수집하는 것처럼 들리고, 실제 그렇지만, 이로부터 실질적인 개선의 기회를 얻을 수 있습니다. 이러한 데이터 수집에 동의해 주시는 분께 JetBrains는 다음을 약속합니다.- 민감하거나 개인적인 정보를 절대 공유하지 않습니다.
- 데이터는 철저하게 보호됩니다.
- 데이터 접근 권한은 승인된 담당자와 승인된 활용 목적에만 제한됩니다.
수집되는 데이터 유형과 해당 데이터가 보호되는 방식에 대해 자세히 알아보세요.
익명의 원격 측정은 기능 사용 현황과 성능을 평가하는 데 매우 중요합니다. 특정 목적에 최적화된 Mellum과 같은 특수 모델을 학습시키려면 대규모 코드베이스를 처리하는 복잡한 전문 작업에서의 정확도나 생성 속도, 경제성 등 세부적인 코드 관련 데이터가 필수적입니다. 이는 또한 피드백 루프에도 중요하며 JetBrains에서 구축 중인 모든 AI 기능을 더 빠르게 반복 처리하기 위한 기반이 되기도 합니다.
이 데이터는 제품 분석과 모델 평가에 사용될 뿐만 아니라 자체 모델 학습에도 사용됩니다. 이는 오로지 사용자의 일상 작업에서 JetBrains 제품의 활용성을 높이는 데 목적을 두고 있습니다. 절대 제3자와 데이터를 공유하지 않습니다.
여러분의 코드는 여러분의 작업물이며, 앞으로도 저희는 그렇게 대할 것입니다. 데이터에 대한 통제권은 여전히 여러분에게 있습니다. IDE에서 언제든지 데이터 공유 여부를 변경할 수 있고 원할 경우 동의를 철회하여 즉시 공유를 중단할 수 있습니다.
참여할지 결정하셨나요?
AI 트레이닝을 포함해 제품 개선을 위한 데이터를 얻기 위해 JetBrains는 몇 가지 데이터 공유 프로그램을 시작합니다. 이 모든 프로그램은 다음과 같이 개인정보 보호를 염두에 두고 설계되었습니다.
- 비상업적 사용자: 공유 거부 옵션
일부 IDE는 교육, 취미 프로젝트 및 오픈 소스 작업에 이미 무료로 제공되고 있습니다. 이러한 경우, 데이터 공유가 기본적으로 활성화되어 있지만 설정에서 세부적인 코드 관련 데이터 공유를 언제든지 해제할 수 있습니다.
- 조직
조직용 라이선스를 보유한 사용자는 관리자가 회사 차원에서 공유를 활성화하는 경우에만 세부적 코드 관련 데이터를 공유할 수 있습니다. 이는 실수에 의한 IP 유출을 막기 위한 조치입니다. 이 옵션은 아직 실험적 단계이기 때문에 데이터 공유 의사가 있는 일부 회사에 한해 무료 All Products Pack 라이선스를 제공할 예정입니다. 관심이 있으시면 대기자 명단에 등록해 주세요. 신청을 검토한 후 승인되면 알려 드리겠습니다.
상업용 라이선스, 무료 평가판, 무료 커뮤니티 라이선스 또는 EAP 빌드를 이용하는 개인의 경우, 현재로서는 달라지는 것이 없습니다. JetBrains와 데이터를 공유하려면 설정에서 옵션을 활성화할 수 있습니다. 프로그램 참여를 원하지 않는 기업의 경우, 달라지는 것이 없으며 데이터에 대한 통제권은 관리자에게 있습니다.
변경 시기
업데이트된 새로운 데이터 공유 옵션은 몇 주 후로 예정된 JetBrains IDE 2025.2.4 업데이트 출시와 함께 공개됩니다. 비상업적 사용자는 이용약관 업데이트에 관한 알림을 받게 됩니다. 다른 유형의 라이선스 보유자의 경우, 동의를 제공하지 않았다면 달라지는 것은 없습니다.
새로운 데이터 수집 방식이 반영되도록 JetBrains AI 서비스 약관도 변경했습니다.
설정 안내
JetBrains IDE의 Settings(설정) | Appearance & Behavior(모양 및 동작) | System Settings(시스템 설정) | Data Sharing(데이터 공유)에서 데이터 공유 여부를 제어하는 옵션을 찾을 수 있습니다.

공유 의사가 없거나 법적인 이유로 프로그램에 참여할 수 없는 회사의 경우, 달라지는 것은 없으며 계속해서 관리자가 데이터를 완벽하게 통제합니다. 관리자는 JetBrains 계정에서 설정을 확인할 수 있습니다.

사용자의 선택으로 완성되는 공정한 거래
이 주제에 대해 찬반이 갈릴 것으로 생각되지만 이번 변경이 JetBrains 도구와 여러분에게 가져다줄 가치는 분명하다고 생각합니다. 당사의 의도와 조치는 투명한 방식으로 제시되며 데이터를 공유할지 여부에 대한 최종 선택은 여러분에게 달려 있습니다.
참여하는 데 부담이 없으시다면 IDE에서 데이터 공유를 활성화하거나 회사를 대기 명단에 등록해 주세요. 실제 개발 현장의 요구를 충족하는 AI 도구를 함께 만들어 주셔서 감사합니다. JetBrains는 이를 안전하고 책임감 있게, 그리고 사용자의 통제하에 개발해 나가겠습니다.
게시물 원문 작성자