C 언어를 이용한 최빈값 알고리즘 구현

  • 4 minutes to read

최빈값(MODE)은 특정 범위의 데이터에서 가장 자주 발생하는 값을 의미합니다. 이번 아티클에서는 C 언어를 사용하여 최빈값을 찾는 알고리즘을 설명하고 예제 코드를 제공합니다. 이 예제에서는 0부터 100점까지의 범위로 한정된 점수 데이터에서 최빈값을 찾는 방법을 설명합니다. 최댓값 알고리즘을 확장하여 인덱스의 카운트를 사용하여 최빈값을 구합니다.

코드: mode_algorithm_c.c

#include <stdio.h>

int main(void)
{
    // [1] 입력: 자료구조
    int data[10] = { 1, 2, 5, 4, 5, 3, 3, 5, 5, 8 }; // 인위적으로 5를 여러 개
    int count[10 + 1] = { 0, }; // N + 1개
    int mode = 0; // 최빈값
    int max = 0; // INT_MIN
    int i;

    // [2] 처리: 알고리즘: 최빈값
    // [A] 데이터의 인덱스의 카운트 알고리즘 적용
    for (i = 0; i < 10; i++) {
        count[data[i]]++; // 데이터를 인덱스로 보자... 그것의 카운트 증가 
    }
    // [B] 최댓값 알고리즘 적용
    for (i = 0; i <= 10; i++) {
        if (max < count[i]) {
            max = count[i]; // MAX 알고리즘
            mode = i;
        }
    }

    // [3] 출력: 콘솔, 윈도우, 웹, 장치
    printf("최빈값: %d, %d번 나타남\n", mode, max); // 5가 4번 나타남

    return 0;
}
최빈값: 5, 4번 나타남
  1. 먼저 데이터 배열과 카운트 배열을 초기화합니다. 데이터 배열에는 점수 데이터가 저장되며, 카운트 배열은 각 점수의 발생 횟수를 저장합니다.
  2. 데이터 배열을 순회하며 각 점수의 발생 횟수를 카운트 배열에 저장합니다. 데이터 배열의 값이 카운트 배열의 인덱스가 되며, 카운트 배열의 값을 증가시킵니다.
  3. 카운트 배열을 순회하며 최빈값을 찾습니다. 최댓값 알고리즘을 사용하여 카운트 배열의 최댓값을 찾고, 그 인덱스가 최빈값이 됩니다.
  4. 최종적으로 구한 최빈값과 그 값이 몇 번 나타났는지를 출력합니다.

이 예제 코드를 실행하면, 주어진 데이터 배열에서 최빈값인 5와 그 값이 총 4번 나타났음을 확인할 수 있습니다. 이 알고리즘은 범위가 한정된 데이터에서 최빈값을 찾을 때 유용하게 사용될 수 있습니다. 예를 들어, 학생들의 시험 점수나 설문 조사 결과 등에서 최빈값을 구하는 데 활용할 수 있습니다.

코드를 수정하여 다양한 데이터 세트에서 최빈값을 찾아볼 수 있습니다. 데이터 배열의 크기와 범위를 변경하거나, 초기 데이터 값을 조정하여 결과를 확인해보세요.

이렇게 C 언어를 사용하여 최빈값 알고리즘을 구현하는 방법을 알아보았습니다. 이 알고리즘을 이해하고 사용하면 데이터 분석에서 자주 발생하는 값을 찾는 데 도움이 됩니다.

VisualAcademy Docs의 모든 콘텐츠, 이미지, 동영상의 저작권은 박용준에게 있습니다. 저작권법에 의해 보호를 받는 저작물이므로 무단 전재와 복제를 금합니다. 사이트의 콘텐츠를 복제하여 블로그, 웹사이트 등에 게시할 수 없습니다. 단, 링크와 SNS 공유, Youtube 동영상 공유는 허용합니다. www.VisualAcademy.com
박용준 강사의 모든 동영상 강의는 데브렉에서 독점으로 제공됩니다. www.devlec.com