====== Python ====== ===== 몰랐던 문법과 팁들 ===== * and와 or 는 True/False 가 아니라 마지막으로 이밸류에이트된 값을 돌려준다 ([[https://docs.python.org/3/reference/expressions.html#boolean-operations|링크]]) * JS에서 흔히 쓰듯이, (x if x else default) 와 같은 식을 (x or default)로 줄여 쓸수 있다. 딱히 안티패턴도 아닌듯 하다. * int형 변수의 빌트인 메소드인 bit_length()는 부호와 선행 0을 제외하고, 이진수로 정수를 나타내는 데 필요한 비트 수를 돌려줍니다. ([[https://docs.python.org/ko/3/library/stdtypes.html#int.bit_length|링크]]) * >>> n = -37 >>> bin(n) '-0b100101' >>> n.bit_length() 6 * enumerate에는 옵셔널한 두번째 인자 start가 있다. 두번째 인자를 주어서 enumerate(l, 5) 으로 쓰면 (5, l[0]), (6, l[1]), ...이런식으로 이터레이트한다 * round 함수가 반올림을 하는 방법은 소수부가 0.5이상이면 올림하는 것이 아니라, '가장 가까운 정수값을 리턴' 하는 것이다. 소수부가 0.5일 때는 가장 가까운 짝수로 맞추기 때문에 예상과 달리 내림을 하는 경우도 있다! * ([[https://docs.python.org/ko/3/library/functions.html#round]]) * x를 2로 나눈 값을 반올림 하고 싶은 경우, 원하는 대로 동작하지 않는 round(x/2) 대신 sum(divmod(x,2))로 쓰면 깔끔하다 * python의 %%{정수}//{정수}%% 는 나눠진 실수값을 floor 한 결과를 돌려준다. 음수일 경우에 c언어와 다른 결과를 낸다. * %%-5 // 3 == -2 이라는 뜻%% * %%c의 나눗셈과 동일한 결과를 얻고 싶으면 x//y 대신에 int(x/y)을 쓰면 된다.%% * 나눈 값에 ceil을 해야 할 경우. 원칙적으로는 math.ceil(x/y) 이지만, 실수 연산을 해야 돼서 속도가 느리다 * %%동일한 값을 얻기 위해서는 -(x // -y) 를 쓰거나, (x + y - 1) // y 을 쓸 수 있다. 전자는 위에 언급한 c와 다른 python의 // 계산 방법에 의존하기 때문에 후자보다 덜 직관적이다..%% * 파이썬의 자체 정수형은 이미 큰 수의 곱셈에 대해서 빠르게 동작하도록 구현되어있지만, 더욱 빠른 곱셈이 필요하면, decimal.Decimal로 변환해서 사용하면 된다. * [[ps:고속 푸리에 변환]]과 [[ps:problems:boj:13277|큰 수 곱셈]] 참고 * type 힌트를 줄 때 자신의 타입을 레퍼해야 하는 경우를 처리 못하는 문제가 있다. 대표적으로 이렇게 쓰면 에러가 난다 * @dataclasses.dataclass class Node: value: int left: Node right: Node * 해결하려면 __future__,annotations 을 임포트한다 * from __future__ import annotations * 3.10부터는 디폴트로 처리될 것이라고 한다. * NamedTuple은 collections.NamedTuple와 typing.NamedTuple 두가지가 있다. typing.NamedTuple이 새로 추가된 거고 기능이 더 유용하니 이걸 쓰자. * 사소한 속도 비교.. * for-loop 이랑 break를 쓰는것이 all()을 쓰는것보다 빠르다 * https://stackoverflow.com/questions/49576180/all-vs-for-loop-with-break-performance * 비트 연산을 통한 곱하기 나누기는 빠르지 않다 * https://stackoverflow.com/questions/37053379/times-two-faster-than-bit-shift-for-python-3-x-integers * %%2를 곱할때는 그냥 x*2가 x<<1보다 빠르다. 2로 나눌때는 x>>1이 x//2보다 빠르다%% * https://stackoverflow.com/questions/54047100/why-are-bitwise-operators-slower-than-multiplication-division-modulo * %%x*8, x//8, x%8 이 x<<3, x>>3, x%7 보다 빠르다%% * x=y=z 형태의 assignment의 수행 순서는 c언어와 다르다. c언어에서는 대입연산자가 대입된 값을 결과로 내어주는 원리라서 x=(y=z)순서로 계산되지만, 파이썬에서는 맨 우측에 있는 값을 왼쪽값부터 순서대로 대입한다. 즉 x=z 를 수행하고, y=z를 수행하는 순서. * 링크드리스트 같은 것 짜다가 이것때문에 버그나면 찾기 정말 힘들다 ㅜ * [[https://docs.python.org/3/reference/simple_stmts.html#assignment-statements]] * 아이템들을 0,..,n 으로 매핑하기 * 예를들어 names = ['abc', 'def', 'cc', 'dd'] 이런 리스트가 있을때, 저 아이템들을 0,1,2,3으로 매핑하는 테이블을 만들고 싶음 * names가 미리 다 주어져있다면.. id_by_name = {x:i for i, x in enumerate(set(names))} 으로 만들수 있다 * names가 계속 추가되는 상황이라면.. id_by_name = collections.defaultdict(itertools.count().__next__) 으로 만드는 기발한 방법이 있다. ===== 속도 최적화 vs 예쁜 코드 ===== * **기존에 속도에 관해서 언급한 부분들은 Python 3.11 이후에는 맞지 않을 수 있으니 무시할 것. 결정 자체는 바뀌지 않는다** * [[Python 코드 수행시간]] * 파이썬에는 시간이 오래 걸릴것처럼 안보이는데 실제로는 시간이 많이 걸리는 부분들이 있다. * 이런 것들을 어떤 방식으로 쓸지 정리해보자. 경우에 따라서는 가독성을 위해서 일부러 속도가 더 느린 쪽을 선택하는 것도 필요하다 * Type annotation => 쓴다. * 단순히 타입 어노테이션을 쓰는것만으로 수행시간이 좀 늘어날수 있다. * 타입 어노테이션을 쓰기 위해 collection.abc나 typing을 임포트하게 된다면 더 많은 추가시간이 걸린다. * [[Python 코드 수행시간#타입 어노테이션]] * 하지만 그래봐야 최대 200ms 정도이다. 이 시간를 아끼자고 타입 어노테이션을 안쓰는 것은 아닌듯 하다. 라이브러리에서는 항상쓰고, 그 외에도 필요하면 쓰자. * TypeAlias => 쓴다 * 우선 Type annotation을 사용한다는 전제이다. 복잡한 타입에 대한 alias 변수를 만들때, 그 변수의 타입에 TypeAlias 표기를 해주느냐의 여부이다. * TypeAlias를 붙여주기 위해서는 typing을 반드시 import해줘야 하므로 100ms 가량의 추가시간이 걸린다. * 아주 흔히 쓰이는 Graph 타입 역시 Graph: TypeAlias = Sequence[Collection[int]] 으로 쓰여지게 되므로, dfs,bfs 등등 모든 graph 관련 문제의 수행시간이 100ms 가량 길어진다.. * 하지만 그래봐야 인풋크기에 비례해서 커지는것도 아니고, 감수할만 하다. 라이브러리에서는 항상쓰고, 그 외에도 필요하면 쓰자. * List * l.pop() 와 del l[-1] 의 속도차이는 거의 없다 => l.pop()를 사용하자. * l.append(x)와 l += [x] => l.append()를 사용. * l.extend([1,2,3])과 l += [1,2,3] 의 속도차이는 거의 없다. => l.extend() 를 사용하자 * Set * |=, &=, -=, ^= 대신에 update, intersection_update, difference_update, symmetric_difference_update를 사용하자. (List와 일관성을 유지하기 위해서) * Tuple * 리스트를 튜플로 바꿀때 => tuple(l) 을 쓰자 * tuple(l) vs (*l,) 인데.. 가독성은 비슷하고, 속도는 tuple(l)이 3배정도 빠르다. (l의 길이가 작으면 거의 무의미한 차이이기는 하다) * functools.reduce => 사용하지 않는다. * 합을 구할때는 sum(), 곱을 구할때는 math.prod() 를 쓰면 된다. * 그 외의 경우(예를 들면 xor) 에는 functools.reduce(operator.xor, nums) 보다 그냥 루프를 돌면서 계산하는게 속도가 좀더 빠르다. 그렇다고 functools.reduce를 쓰는것이 루프를 쓰는것보다 딱히 엄청 컴팩트한것도 아니다. 그냥 루프를 쓰자 * 11868 문제에서 reduce는 104ms, 루프는 64ms가 걸렸다 * %% ** 연산자 => 쓸 일이 별로 없다 %% * 제곱근의 정수부 => math.isqrt 를 쓴다 * %%int(n**0.5)와 math.isqrt(n) 중에서 선택. 속도 차이는 별로 신경 안써도 된다. 적어도 100,000번 이상은 이 계산을 해야 속도 차이가 미세하게 나는데 (isqrt쪽이 20%정도 빠르다) 그런 경우는 별로 없었기에.. 그냥 보기에 예쁜걸로 하자. math.isqrt(n)이 좀더 의도를 명확히 하는 느낌이니 이쪽으로 사용하자 (import math가 번거롭지만 감수하자)%% * 제곱근 => 역시 math.sqrt 를 쓴다 * %%n**0.5와 math.sqrt(n) 의 차이인데.. 우선 이경우는 n**0.5쪽이 미세하게 빠르다. 하지만 일관성을 위해 math.sqrt(n)을 쓰자.%% * 제곱 => x*x를 쓴다 * %% x**2 보다 x*x 가 많이 빠르다. 연산이 한번 더 들어가서 (a-b)**2 꼴이 되더라도 (a-b)*(a-b)가 더 빠르다. %% * n승 => 필요하면 써야지.. * 이때는 필요하면 쓰겠지만.. n이 커지면 보통 모듈러를 취해야 할 경우가 많을텐데. 그러면 아마 pow(x, n, MOD)를 쓰게되지 않을까.. * enumerate * 일반적인 경우 => 당연히 가능한 사용한다. * zip과 함께 쓸 경우 => 사용하지 않는다 * enumerate(zip(list1, list2)) 이런식으로 쓰고 싶을때가 가끔 있는데. 그때는 그냥 * for i, (x1, x2) in enumerate(zip(list1, list2)): ... 이것보다는 * for i, x1, x2 in zip(range(n), list1, list2)): ... 이거를 쓴다. * 코드도 짧고 속도도 후자가 빠르다. ([[https://www.acmicpc.net/source/49155672|전자 코드]] 1508ms vs [[https://www.acmicpc.net/source/49155840|후자 코드]] 1200ms) * itertools.count * c++에서의 for(int i=1; cond(i); ++i) {doSomething();} 에 대응되는 용법으로 사용되는 경우. => 사용한다 * 이 경우에 파이썬에서 대체가능한 후보는 크게 3가지이다 * itertools.takewhile 같은 방법은 후보에도 껴줄수 없다; * 1) while-loop * i = 1 while cond(i): do_something() i +=1 * 2) for-loop with range * for i in range(MAX): if not cond(i): break do_something() * 3) for-loop with itertools.count * for i in itertools.count(): if not cond(i): break do_something() * 속도 측면에서는 2,3,1 순으로 빨랐다. * 코드의 예쁜정도에는 장단점이 있다. * (1)은 변수를 루프 밖에서 선언해야 한다는 점. do_something()에 해당되는 부분이 길어지면 루프변수를 증가시키는 부분이 루프 초기화 부분과 멀어져서 눈에 잘 안띈다는점이 감점 요인이다. * (2)는 MAX에 해당하는 값을 로직마다 다르게 잡아줘야 하고, 때로는 그값을 잡는게 어려울수도 있다는 점. 코드만 봐서는, MAX값에 도달하기 전에 반드시 종료조건을 만족하는 i가 등장한다는 것이 드러나지 않는다는 점이 감점요인. * MAX를 sys.maxsize 나 뭔가 무한대의 느낌을 주는 값으로 일정하게 쓰는 방식으로 위의 단점들을 커버할수 있긴 한데.. 그러면 다른 단점들이 생긴다;; * (3)은.. itertools.count가 좀 생소하게 보일수 있다는 점과, import하는게 귀찮다는 점이 감점요인. * 종합한 결론: (3)을 쓰자. 그래도 이게 제일 의도를 명확하게 드러내준다. (2)에 비해 속도가 느린것을 감수할정도로. * MAX에 도달해서 끝나는 상황이 가능한 경우.. 즉, cond(i)가 i count = 0 while cond(): count += 1 do_something() * divmod => 여간해서는 쓰지 말자. * %%놀랍게도 // 와 % 을 각각 하는것보다 느리다. (펑션콜 오버헤드때문에). n이 매우 커지면 divmod쪽이 빨라진다고 한다%% * https://stackoverflow.com/questions/30079879/is-divmod-faster-than-using-the-and-operators * 이것을 쓰는 쪽이 가독성이 매우 좋아질 경우에만 쓰도록 하자. 그런데 그런 경우는 거의 못봤다.. * class * %%__slots__%% => 사용하자 * 자주 접근하는 멤버변수라면 접근 속도면에서 이득이 있고, 메모리도 줄어든다고 하고, 안쓸 이유가 없다. * xxx = self.xxx 트릭 => 비사용 * 어트리뷰트 룩업 시간을 줄이기 위한 트릭인데.. slots를 사용한 상태라면 속도면에서 큰 이득이 없다. * 삼항연산자 * a if cond else b => 이 형태로 쓴다. * (b,a)[cond] 는 보기에 매우 불편하다. * map, filter => 기본적으로 비사용 * 기본원칙은 list comprehension / generator expression으로 통일하는것. * map을 쓰기 위해서 lambda 함수를 만들어야 하는 경우에는 원칙에 예외가 없다. * lambda없이 사용할 때에는, map이 더 빠른 경우가 있기는 하다.. => 라이브러리 코드에서만 허용하자. * 예를 들면 dot-product를 구할때에 map 버전이 빠르다. [[ps:problems:boj:1533]] 기준, 472ms vs 788ms. * sum(map(operator.mul, x_vec, y_vec)) => 가장 빠르다 * sum(x*y for x,y in zip(x_vec, y_vec)) * sum([x*y for x,y in zip(x_vec, y_vec)]) => 가장 느리다 * functools.cache => 사용하자 * Top-down으로 재귀적으로 DP를 계산할때 메모이제이션을 간단하게 처리해주는 데코레이터이다. * 그냥 dict를 이용해서 table을 직접 만들어서 메모이제이션을 처리해주면 조금 더 빠르기는 한데.. 그렇게 큰 차이는 안난다. * [[ps:problems:boj:17613]]기준으로 268ms vs 296ms (python 3.11) * 속도차이가 크지 않고, 코드가 많이 깔끔해지므로 라이브러리를 사용하자. * min, max => 가급적 사용 * 인자가 두개인 경우에는 if문과 비교연산자로 바꿀수 있고, 인자로 iterable가 들어오는 경우에는 for loop으로 바꿀수 있다. * 두경우 다 min 함수를 안쓰고 구현하는 쪽이 더 빠르다. 하지만 함수를 쓰는편이 코드상으로는 당연히 더 컴팩트하다 * 기본적으로는 웬만하면 min 함수를 사용하는 것으로 한다. * a = min(a, b) 와 같은 코드의 경우 if b merged_list = list1 + list2 merged_list.sort() * 원래 머지를 위해서 제공되는 라이브러리함수는 heapq.merge이다. * 여러 리스트를 병합할수 있고, 이터레이터를 리턴해준다. 여러 리스트를 힙에 저장해서 갖고 있기 때문에, 리스트가 2개밖에 없을때에는 투머치다.. * 그냥 리스트 두개를 합친 다음에 정렬하는 것이 더욱 빠르다 * 파이썬의 timsort가 이렇게 거의 정렬된 데이터에 대해서는 O(n)에 가깝게 동작하기 때문이다 * [[https://earthly.dev/blog/python-timsort-merge/]]에 따르면 합친 리스트의 길이가 100만 이하라면 그냥 소트를 쓰라고 한다 ===== 버전별 추가 피쳐 ===== * v3.8 * Assignment expression * f'{expr=}' * pow(x, -1, mod) * math.perm, math.comb * math.isqrt * v3.9 * graphlib * @cache * v3.10 * Structural Pattern Matching * Advanced Type Hint * list[int] style (= typing.List[int]) * int | str style (= typing.Union[int, str]) * zip(..., strict=x) * bisect.bisect(..., key=x) * itertools.pairwise * @dataclasses.dataclass(..., slots=xxx) * v3.11 * Faster python이 적용됨 * Self 타입 * v3.12 * type parameter syntax * itertools.batched * math.sumprod * v3.13 * ps기준 별차이 없음 ==== 각 사이트별 python 버전 ==== * (2024/12/06 기준) (pypy는 대응되는 python 버전으로 표시) * 백준 - python 3.13.1 / pypy 3.10.12 * atcoder - python 3.11.4 / pypy 3.10 * (+numpy,sortedcontainers,networkx,ac-library-python, ...) * 코드포스 - python 3.8.10 / pypy 3.10 * 리트코드 - python 3.11 (+sortedcontainers) * 프로그래머스 - python 3.8.5