티스토리 뷰

💌정보/알쓸잡

빅데이터란?

핀아 2022. 6. 12. 14:43
반응형

 

 

1. 빅데이터란 무엇을 말하는가?

: 빅데이터란 디지털 환경에서 생성되는 데이터로 그 규모가 방대하고, 생성 주기가 짧고, 형태도 수치 데이터 외 문자와 영상 데이터도 포함하는 대규모 데이터를 말합니다. 빅 데이터는 단일 데이터 집합의 크기가 수십 테라바이트에서 수 페타바이트에 이르며, 그 크기가 끊임없이 변화합니다. 초기에 빅데이터의 공통적인 특징을 ‘3V’로 정의하였습니다. 3V는 애널리스트 더그 레이니(Doug Laney)가 처음 정의하였는데 데이터의 크기(Volume), 데이터 입출력의 속도(Velocity), 데이터 종류의 다양성(Variety)이라는 세 가지 특징입니다. 크기(Volume)는 데이터의 물리적 크기로 기업 데이터, 웹 데이터 등 페타바이트(PB) 규모로 확장된 데이터를 말하고 속도(Velocity)는 데이터 처리 능력을 의미합니다. 데이터를 수집 · 가공 · 분석하는 일련의 과정을 실시간 또는 일정 주기에 맞춰 처리할 수 있어야 합니다. 다양성(Variety)은 데이터의 형태로 관계형 데이터베이스(RDB)에 저장된 데이터인지, 비디오와 이미지 같은 비정형 데이터인지 등 데이터의 형태에 따라 그 종류가 나뉩니다. 빅데이터는 이 모든 데이터를 포함하기 때문에 이를 다룰 수 있는 기술이 필요합니다. 이 3V는 이후 가장 널리 사용되는 빅 데이터의 정의가 되었습니다. 최근에는 가치(Value) 또는 정확성(Veracity)이라는 새로운 특징을 추가하여 4V, 5V 등으로 불리는데 보통 그 중의 네 번째 특징으로 가치(Value)를 더해 4V로 재정의합니다. 빅데이터에서 가치(Value)가 주요 특징으로 추가된 이유는 엄청난 규모뿐만 아니라 비정형적인 데이터로 이루어져 있다는 점과 데이터가 만들어낼 무한한 창조가치 때문입니다. 데이터들이 시간이 지나면서 매우 빠르게 전파, 또는 변화함에 따라 그 전체를 파악하고 일정한 패턴을 발견하는 것이 어렵게 되면서 가치 창출의 중요성이 강조되었습니다.

 


2. 빅데이터의 활용 사례

: 현재 빅데이터는 여러 분야에서 응용되고 있는데 전공인 회계/세무, 금융 분야에서의 활용 사례를 찾아보았습니다. 
첫 번째로 국세청은 2015년 빅데이터의 세금 버전이라고 할 수 있는 엔티스(NTIS) 시스템을 구축하였습니다. 이로 인해 국세의 신고 안내부터 신고서 접수, 세금 납부, 세무조사까지 국세 행정의 모든 과정을 전산화하여 세무행정을 강화했습니다. 세금에 대한 국세청의 맞춤형 서비스로 신고해야 할 수입액을 미리 알려주어 납세 편의성을 도우면서도, 탈세와 체납 행위는 철저하게 관리해 불성실 신고자에 대해서는 사후 검증과 세무조사가 뒤따를 것을 고지하는 사전 성실신고 안내제도를 강화했습니다. 두 번째로 금융감독원에서 빅데이터 전담조직을 올해 신설하여 빅데이터와 인공지능을 이용한 빅데이터 분석체계 마스터플랜으로 소비자 민원과 기업의 분식회계, 주가조작 등을 감시할 예정입니다. 실제로 미국 국세청에서도 2011년 통합형 탈세 및 사기 범죄 방지 시스템을 구축하여 납세자의 과거 행동 정보를 분석한 다음 사기 패턴과 유사한 행동을 검출한 뒤 고의 세금 체납자를 찾아내어 연간 3,450억 달러에 이르는 세금 누락을 막아낸 경우가 있어 이러한 우리나라의 지속적인 빅데이터 활용 또한 국가적으로 계속 이바지될 수 있다고 생각합니다. 마지막으로 우리은행은 국내 최초로 빅데이터를 활용한 기업진단시스템 빅아이(Big Eye)를 기업 여신 리스크관리을 위해 도입했습니다. 빅아이는 기업 관련 빅데이터를 통합 및 데이터베이스화하고 200여 개의 리스크 분석지표를 분석해 기업의 부실가능성을 4단계 등급으로 안내합니다. 이처럼 빅데이터는 IT산업에 국한되지 않고 국가, 기업 등 다방면에서 활용되고 있습니다.

 


3. 현재 빅데이터의 문제점 또는 해결과제는 무엇인가?

: 새로운 기술이 적용되면 관련된 다양한 분야에서 편의성을 제공하지만 그만큼 우려되는 문제점도 발생하기 마련입니다. 빅데이터도 미래 예측이 가능하며 삶의 질이 향상되는 장점이 있으나 그 외 단점도 고려되어야 합니다. 현재 빅데이터의 문제점으로 빅데이터에 대한 사람들의 인식 부족 및 편리성에 의한 개인 개성 상실과 개인정보침해가 있습니다.
 국가와 많은 기업이 빅데이터 기술을 이용하고 있지만, 그에 비교해 이를 일상에서 체감하는 사람들은 적습니다. 큰 비용을 투자하여 개발된 빅데이터 활용 시스템들이 제대로 값어치를 못 하는 경우도 있으며 수치로 계산된 예측일 뿐 언제나 예외 사항은 존재합니다. 사람들이 데이터를 통한 추천 등의 편리함을 지나치게 신뢰하고 익숙함에 갇혀 있으면 언젠가 개인의 개성이나 의사 결정권에 악영향을 줄 수 있다고 생각합니다. 또한, 빅데이터의 이면으로 정보의 독점으로 사회를 통제하는 관리 권력, 혹은 그러한 사회체계를 일컫는 ‘빅브라더’가 있습니다. 빅데이터는 대량의 개인정보가 수집 및 관리되므로 고의 또는 과실에 의해 정보가 유출되거나 악용되고, 정보의 경계가 모호해 사생활이 침해되는 경우도 있습니다. 이러한 문제점의 사례로 금융기관, 통신사 등의 개인정보 유출과 미국에서 유통업체인 ‘TARGET’이 고객의 구매 정보를 분석해 여고생인 고객의 임신 및 개월 수를 파악하고 해당 고객에게 할인쿠폰을 발생해 문제가 됐던 경우가 있습니다. 빅데이터 분석은 성공적이었지만 사생활 유무의 문제와 일반적으로 생각하지 못했던 정보까지도 데이터화가 될 수 있다는 사실에 논란이 있었습니다. 따라서 빅데이터에 대한 리스크를 최대한 줄이기 위해서는 앞으로 개인정보침해, 개인정보 보안 유지에 대한 강화된 대책이 필요하며 안일한 태도로 정보 유출에 대한 책임을 전가하기보다는 그 전에 해결책을 준비하고 철저하게 보안 체계를 구축해야 합니다.