소개
- 알고리즘 스터디를 참여하며 작성하는 TIL입니다.
- TIL이란? 'Today I Learned'의 약자로, 한국어로 번역하면 '오늘 내가 배운 것'이란 의미입니다.
- 제가 오늘 하루 배운 것 혹은 경험하고 느낀 것들을 기록하고 회고하는 습관을 기르기 위한 글입니다.
문제 & 키워드
- 프로그래머스 - 테이블 해시 함수 (문제 링크)
- 정렬
- 해시 함수
- 비트 XOR 연산
비트 XOR 이란?
비트 연산에서 XOR(배타적 논리합) 연산은 두 비트가 다를 때 1을 반환하고, 같을 때 0을 반환하는 연산입니다. XOR는 "exclusive OR"의 줄임말입니다. 두 비트에 대한 XOR 연산의 결과는 다음과 같습니다
- 0 XOR 0 = 0
- 0 XOR 1 = 1
- 1 XOR 0 = 1
- 1 XOR 1 = 0
이 연산은 보통 2진수로 표현된 두 숫자에 대해 각 비트를 비교하면서 수행됩니다.
예를 들어, 두 8비트 숫자 10101010 (170)과 11001100 (204)에 대한 XOR 연산을 생각해 봅시다.
- 10101010
- 11001100
이 두 숫자의 각 비트를 비교하여 XOR 연산을 수행하면 다음과 같은 결과를 얻습니다:
1 | 0 | 1 | 0 | 1 | 0 | 1 | 0 |
1 | 1 | 0 | 0 | 1 | 1 | 0 | 0 |
- | - | - | - | - | - | - | - |
0 | 1 | 1 | 0 | 0 | 1 | 1 | 0 |
이 결과는 01100110 (102)입니다. 따라서 170 XOR 204는 102가 됩니다.
비트 단위의 XOR 연산은 다양한 용도로 사용될 수 있는데, 주로 암호화, 데이터 무결성 검사, 단순한 비트 마스크 연산 등에 활용됩니다.
문제 설명
완호가 관리하는 어떤 데이터베이스의 한 테이블은 모두 정수 타입인 컬럼들로 이루어져 있습니다. 테이블은 2차원 행렬로 표현할 수 있으며 열은 컬럼을 나타내고, 행은 튜플을 나타냅니다.
첫 번째 컬럼은 기본키로서 모든 튜플에 대해 그 값이 중복되지 않도록 보장됩니다. 완호는 이 테이블에 대한 해시 함수를 다음과 같이 정의하였습니다.
- 해시 함수는 col, row_begin, row_end을 입력으로 받습니다.
- 테이블의 튜플을 col번째 컬럼의 값을 기준으로 오름차순 정렬을 하되, 만약 그 값이 동일하면 기본키인 첫 번째 컬럼의 값을 기준으로 내림차순 정렬합니다.
- 정렬된 데이터에서 S_i를 i 번째 행의 튜플에 대해 각 컬럼의 값을 i 로 나눈 나머지들의 합으로 정의합니다.
- row_begin ≤ i ≤ row_end인 모든 S_i를 누적하여 비트 XOR 한 값을 해시 값으로서 반환합니다.
테이블의 데이터 data와 해시 함수에 대한 입력 col, row_begin, row_end이 주어졌을 때 테이블의 해시 값을 return 하도록 solution 함수를 완성해주세요.
제한 사항
- 1 ≤ data의 길이 ≤ 2,500
- 1 ≤ data의 원소의 길이 ≤ 500
- 1 ≤ data[i][j] ≤ 1,000,000
- data[i][j]는 i + 1 번째 튜플의 j + 1 번째 컬럼의 값을 의미합니다.
- 1 ≤ col ≤ data의 원소의 길이
- 1 ≤ row_begin ≤ row_end ≤ data의 길이
입출력 예
data | col | row_begin | row_end | result |
[[2,2,6],[1,5,10],[4,2,9],[3,8,3]] | 2 | 2 | 3 | 4 |
입출력 예 설명
정해진 방법에 따라 튜플을 정렬하면 {4, 2, 9}, {2, 2, 6}, {1, 5, 10}, {3, 8, 3} 이 됩니다.
S_2 = (2 mod 2) + (2 mod 2) + (6 mod 2) = 0 입니다.
S_3 = (1 mod 3) + (5 mod 3) + (10 mod 3) = 4 입니다.
따라서 해시 값은 S_2 XOR S_3 = 4 입니다.
문제 접근
이 문제는 다음과 같은 순서로 해결할 수 있습니다.
- 데이터 정렬
- 주어진 col번째 컬럼의 값을 기준으로 오름차순 정렬을 수행합니다.
- 만약 col번째 컬럼의 값이 동일하다면, 첫 번째 컬럼(기본키)의 값을 기준으로 내림차순 정렬합니다.
- S_i 계산
- 정렬된 데이터에서 각 행의 튜플에 대해 S_i를 계산합니다.
- S_i는 i 번째 행의 각 컬럼 값을 해당 행 번호로 나눈 나머지들의 합으로 정의됩니다.
- 비트 XOR 누적:
- row_begin부터 row_end까지의 모든 S_i를 비트 XOR로 누적합니다.
- 최종적으로 누적된 값을 해시 값으로 반환합니다.
풀이 - Java 코드
import java.util.ArrayList;
import java.util.Arrays;
import java.util.List;
class Solution {
public int solution(int[][] data, int col, int row_begin, int row_end) {
int selectIndex = col - 1;
// 1. 데이터 정렬
Arrays.sort(data, (o1, o2) -> {
if (o1[selectIndex] == o2[selectIndex]) {
return o2[0] - o1[0]; // 첫 번째 컬럼 기준 내림차순 정렬
}
return o1[selectIndex] - o2[selectIndex]; // col번째 컬럼 기준 오름차순 정렬
});
List<Integer> si = new ArrayList<>();
// 2. S_i 계산
for (int i = row_begin - 1; i <= row_end - 1; i++) {
int[] sortDatum = data[i];
int result = 0;
for (int j = 0; j < sortDatum.length; j++) {
result += sortDatum[j] % (i + 1);
}
si.add(result);
}
// 3. 비트 XOR 누적
return si.stream().reduce(0, (integer, integer2) -> integer ^ integer2);
}
}
풀이 설명
- 데이터 정렬
- 주어진 col값에 맞게 데이터를 정렬합니다. col번째 컬럼 값을 기준으로 오름차순 정렬하되, 동일한 값이 있으면 첫 번째 컬럼을 기준으로 내림차순 정렬합니다.
- S_i 계산
- row_begin부터 row_end까지 각 행의 데이터를 순회하며, 각 컬럼 값을 해당 행 번호로 나눈 나머지들의 합을 계산합니다.
- 계산된 값을 리스트 si에 저장합니다.
- 비트 XOR 누적
- 리스트 si에 저장된 값을 스트림을 이용해 모두 XOR 연산으로 누적합니다.
- 최종 누적된 값을 반환합니다.
마무리하며
- 이번 문제를 통해 2차원 배열의 정렬과 특정 조건에 따른 값 계산 및 비트 연산을 활용하는 방법을 연습할 수 있었습니다.
- 정렬 조건이 여러 개일 때 스트림을 이용해 효율적으로 계산된 값을 비트 XOR 연산으로 누적했습니다.
- 문제를 해결하면서 코드의 가독성과 효율성을 고려하여 최적의 해결 방법을 고민해보는 좋은 경험이 되었습니다.