티스토리 뷰

반응형
 

프로그래머스

코드 중심의 개발자 채용. 스택 기반의 포지션 매칭. 프로그래머스의 개발자 맞춤형 프로필을 등록하고, 나와 기술 궁합이 잘 맞는 기업들을 매칭 받으세요.

programmers.co.kr


풀이

import re
from collections import Counter

def make_set(string):
    str_set = []
    for i in range(len(string)-1):
        if re.match('^[a-zA-Z]+$', string[i:i+2]):
            str_set.append(string[i:i+2].lower())
    return str_set
    

def solution(str1, str2):

    # 1. 집합 만들기
    set1 = make_set(str1)
    set2 = make_set(str2)
    print(set1, set2)
    
    # 2. 자카드 유사도 계산
    inter = sum((Counter(set1) & Counter(set2)).values())
    union = sum((Counter(set1) | Counter(set2)).values())
    
    # 두 집합 모두 공집합이면 J = 1
    try:
        J = inter/union
    except:
        J = 1
    
    answer = int(J * 65536)
    return answer

풀이과정

  • 문자열을 각각 집합으로 만든다.
    • 정규표현식 re 라이브러리 사용 
    • 두 개씩 잘라서 둘 다 영어인 경우, 소문자로 바꾸어 집합 리스트에 추가한다.
  • 두 집합의 자카드 유사도를 계산한다.
    • collections 라이브러리 Counter 클래스 사용
    • 두 집합 모두 공집합인 경우, 분모인 합집합의 개수가 0이 되어 ZeroDivisionError가 발생한다. 따라서 except문으로 처리한다.
  • 자카드 유사도에 65536을 곱하여 정수부만 출력한다.

정규표현식

문자열을 두 글자씩 잘랐을 때, 두 글자 모두 영어인지 확인하기 위해 정규표현식을 사용하였다.

  • re.match(정규표현식, 문자열) 함수 : 문자열이 정규표현식과 일치하면 Match 객체를, 일치하지 않으면 None을 반환한다.
  • 정규표현식 '^[a-zA-z]+$' 
    • [a-zA-Z] : 영어 대소문자
    • ^ : 첫 글자가 [ ] 안의 정규표현식에 해당
    • + : 연속하는 하나 이상이 글자가 [ ] 안의 정규표현식에 해당
    • $ : 마지막 글자가 [ ] 안의 정규표현식에 해당

Counter 클래스

Counter 객체 간의 교집합과 합집합을 계산할 수 있다.

  • 교집합 & : 한 요소가 집합에 여러 개 존재하는 경우, min값으로 개수를 계산한다.
  • 합집합 | : 한 요소가 집합에 여러 개 존재하는 경우, max값으로 개수를 계산한다.
🪄예를 들어, cnt1 = Counter({'노을' : 2, '미식스' : 1, '모티' : 3})이고, cnt2 = Counter({'노을' : 5, 모티 : '1'}) 이라고 하자. cnt1과 cn2의 교집합 및 합집합은 다음과 같다.

cnt1 & cnt2 = Counter({'노을' : 2, '모티' : 1})
cnt1 | cnt2 = Counter({'노을' : 5, '미식스' : 1, '모티' : 3})

 

반응형
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2025/05   »
1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31
글 보관함
반응형