반응형

2025/12 15

[인비] 인스타그램에는 이제 사람이 살지 않는다

2025년 12월 31일, 오늘 당신의 SNS 타임라인을 가득 채운 얼굴들을 보십시오. 새해 인사를 전하는 그 수많은 얼굴들 사이에서, 당신은 정말로 '사람'을 보고 있습니까? 아니면 거대 모델이 학습한 픽셀의 '최적해'를 보고 있습니까?컴퓨터 비전 기술은 이제 실시간으로 우리의 외모를 '보정'하는 수준을 넘어 '재창조'하고 있습니다. 하지만 이 화려한 시각적 축제 뒤에는 수학적 폭력과 철학적 빈곤이 숨겨져 있습니다.1. 수학적 감옥: 회귀 분석이 낳은 '평균의 저주'비전 AI의 핵심은 결국 데이터의 통계적 분포입니다. 우리가 흔히 말하는 'AI 미인'이나 '표준 얼굴'은 수학적으로 보자면 다차원 공간 상의 '회귀 평균'에 불과합니다.$$f(x) = E[Y|X=x]$$수십억 장의 인스타그램 이미지를 학습..

[3D CV] Lecture 1(part 1). Projective Geometry의 기초와 기하학적 직관

오늘은 NUS(싱가포르 국립대)의 3D Computer Vision 강의 첫 번째 시간인 Projective Geometry(사영 기하학) 파트를 공부하며 정리한 내용을 공유합니다.우리가 흔히 아는 유클리드 기하학($\mathbb{R}^2$)에서 벗어나, 컴퓨터 비전의 언어인 사영 공간($\mathbb{P}^2$)으로 넘어가는 과정에서 마주치는 핵심 개념들과 수식의 '진짜 의미'를 파헤쳐 보았습니다.1. 기본 용어 잡고 가기 (Terminology)본격적인 수식에 앞서, 논문이나 강의에서 자주 등장하지만 헷갈리기 쉬운 용어들을 정리했습니다.Pictorial (픽토리얼):단순히 '화보'라는 뜻이 아닙니다. 3D 비전에서는 '2D 이미지 자체의 시각적 단서(Cues)'를 의미합니다.예: Pictorial D..

3D Computer Vision 2025.12.30

영처기 - 6.2(Discrete Cosine Transform, DCT)

본 포스팅에서는 JPEG 압축 표준의 근간이 되는 DCT(Discrete Cosine Transform)와 양자화(Quantization) 메커니즘을 C언어로 직접 구현하고, 그 결과를 신호 처리 관점에서 분석한다.특히, 표준적인 $8 \times 8$ Block-DCT와 실험적인 Full-Frame (Global) DCT를 비교함으로써, "왜 현대 영상 압축 기술은 이미지를 잘게 쪼개서 처리하는가?"에 대한 해답을 깁스 현상(Gibbs Phenomenon)과 공간적 상관관계(Spatial Correlation) 이론을 통해 규명해 보고자 한다.1. 실험 환경 및 원본 데이터 (Original Domain)실험에는 $512 \times 512$ 크기의 Grayscale Lena 이미지를 사용하였다. 원본..

윤리가 무너지면 성공을 지속할 수 없다.

우리는 흔히 "결과가 수단을 정당화한다"라는 말의 유혹에 빠지곤 합니다. 치열한 경쟁 사회에서 당장의 성과, 눈앞의 이익, 그리고 빠른 승진이나 성공은 너무나 달콤해 보이기 때문입니다. 때로는 "착하게 살면 손해 본다"라는 말이 진리처럼 느껴질 때도 있습니다.하지만 역사를 돌아보고, 수많은 기업과 개인의 흥망성쇠를 지켜보면 한 가지 분명한 진실이 드러납니다. 윤리라는 단단한 지반 없이 쌓아 올린 성공은, 결국 파도 한 번에 쓸려나갈 모래성일 뿐이라는 사실입니다.오늘은 왜 윤리가 단순한 도덕적 의무를 넘어, '성공을 지속하기 위한 필수 생존 전략'인지에 대해 이야기해 보려 합니다.1. 신뢰는 한 번 깨지면 돌아오지 않는 '유리'다비즈니스든 인간관계든 모든 성공의 핵심 자산은 신뢰입니다.윤리적인 태도는 이 ..

의식의 흐름 2025.12.26

영처기 - 6.1(Discrete Cosine Transform, DCT)

안녕하세요! 오늘은 JPEG 압축 기술의 진짜 심장이라고 할 수 있는 DCT(Discrete Cosine Transform, 이산 코사인 변환)와 양자화(Quantization) 과정을 다뤄보겠습니다. 우리가 흔히 쓰는 JPEG 이미지는 단순히 픽셀을 저장하는 것이 아니라, 이미지를 주파수 도메인으로 변환하여 눈에 잘 띄지 않는 고주파 성분을 제거하는 방식으로 용량을 줄입니다. 오늘은 C언어를 사용하여 8x8 블록 단위의 DCT 변환, 양자화, 그리고 다시 이를 복원하는 IDCT 과정까지 전체 파이프라인을 구현해 보겠습니다.1. DCT와 양자화의 이해코드를 작성하기 전에, 도대체 멀쩡한 이미지를 왜 코사인 함수로 변환하는지 알아야겠죠?1-1. 공간 도메인 vs 주파수 도메인우리가 보는 일반적인 이미지는 ..

영처기 - 6.0(Discrete Cosine Transform, DCT)

우리가 매일 사용하는 JPEG 이미지는 어떻게 용량을 1/10로 줄이면서도 화질을 유지할까요? 그 핵심에는 이산 코사인 변환(Discrete Cosine Transform, DCT)이라는 수학적 마법이 숨어 있습니다.단순히 "주파수 변환이다"라고만 알고 넘어가기에는, DCT가 가진 수학적 함의(Implicit Symmetry, Phase Shift)가 매우 깊습니다. 이번 글에서는 DCT-II의 수식적 정의부터, 왜 허수부가 사라지는지, 그리고 어떻게 이것이 압축으로 이어지는지 그 본질을 파헤쳐 봅니다.1. 픽셀(Spatial)에서 주파수(Frequency)로의 전환컴퓨터 비전에서 이미지는 보통 $0 \sim 255$ 사이의 값을 가진 픽셀들의 2차원 배열로 표현됩니다. 이를 공간 도메인(Spatial ..

Wi-Fi Backscatter - Internet Connectivity for RF-Powered Devices

초록사물인터넷이 뜬다고 난리인데, 정작 센서마다 배터리 갈아끼우는 건 지옥임(유지보수의 늪). 그래서 주변 전파를 훔쳐 쓰는 ‘무전원(RF-powered)’ 기기들이 나왔는데, 얘네가 인터넷에 연결되려면 RFID 리더기 같은 비싼 전용 장비가 필요했음. 본 논문은 그런 거 필요 없고, 우리가 이미 집에서 쓰고 있는 와이파이 공유기와 스마트폰을 이용해서 배터리 없는 기기를 인터넷에 연결하는 Wi-Fi Backscatter 기술을 제안함전용 인프라 없이 상용 와이파이 기기와 직접 통신한 최초의 사례이고, 이걸로 진정한 의미의 '배터리 없는 IoT 세상'을 열어보겠다는 야심 찬 연구임서론윗 내용에서 언급한 것처럼 RF-powered 컴퓨터는 작고 배터리도 없어서 IoT 비전에 딱인데, 인터넷 연결이 문제였음...

논문 리뷰 2025.12.22
반응형