본문 바로가기

IT산책353

아무소용없는 방통위의 불법 유해 사이트 차단 도박, 음란, 불법 의약품 판매, 저작권 등의 컨텐츠를 게시하는 사이트들은 정부 각 기관에서 해당 사이트를 검사하고 방송통신위원회에서 심의하여 사이트를 차단하고 있습니다. 주요 내용은 아래와 같습니다. 불법 사이트를 찾아내는 프로세스는 거의 비슷합니다.해당 기관에서 게시판, 카페, 블로그, 트위터 등을 특정 키워드(마권, 경마, 베팅, 배당, 승률 등)로 검색하여기관에서 중요하게 살펴보는 키워드가 들어간 문서들을 모두 수집합니다. 수집된 문서를 각 기관에서 1차로 필터링한 후에 신고가 필요한 사이트는 방송통신위로 보내서2차 심사를 한 후 사이트 차단 여부가 결정되는 것이죠. 각 기관의 데이터 수집은 주로 검색업체 또는 수집업체의 수집 소프트웨어를 납품받아 운영하기에수집 능력은 제각각이라고 보는 것이 맞을.. 2014. 12. 26.
공공기관 지방이전 현황 자료 2014년 5월 30일 현재 2014년에도 많은 공공기관이 지방의 혁신도시로 이전합니다. 검색솔루션과 빅데이터 사업을 주로 하는 저희 회사로썬 공공부문의 고객이 지방으로 이전하게 되어 영업을 진행할 때 과거보다 많은 시간과 비용이 발생하게 되었습니다. 또한, 수주를 하고 난 이후에도 개발자들을 지방에 상주시켜야 하므로 숙소와 출장비 등 추가 경비가 많이 발생하여 사업적으로도 어려움이 생기고 있습니다. 비용도 문제지만 지방에 상주하려는 직원들이 많지 않아서 수행인력 확보에도 업체들이 어려움이 있을 것 있습니다. 아무튼 올해와 내년이면 공공기관 이전이 거의 완료가 되기 때문에 공공사업을 수행하는 업체들은 준비를 단단히 해야 하겠습니다. 2014년 5월 30일 현재까지 공공기관의 지방이전 현황이 나와 있는 자료가 있어 공유합니다. 2014. 7. 2.
2013년 빅데이터 프로젝트에 대한 짧은 생각 2013년의 IT화두는 단연 빅데이터입니다. 이 추세는 내년 2014년까지 유지될 것입니다. 창조경제의 한 축으로 ICT를 좀 밀고 있는 분위기이고 각 기관에서 빅데이터를 기반으로 갖가지 사업을 진행하기 때문입니다. 사실 요즘 공공기관에서는 "빅데이터"란 단어를 쓰지 않으면 IT 관련된 예산을 집행하지 못하는 분위기이기 때문에 SW를 도입하건 홈페이지를 구축하건 빅데이터를 한 꼭지로 잡는 실정이기도 합니다. 관련된 컨퍼런스도 많았습니다. 빅데이터의 정의를 제각각의 입장에서 정리하고 이렇게 저렇게 진행하는 것이 빅데이터이다... 라고 업체마다 서로 주장을 하고 있죠. DB쪽에서는 빅데이터를 저장에 포커스를 두어서 이야기를 하면서 NoSQL쪽을 견제하는 분위기입니다. Hadoop, MongoDB와 같은 No.. 2013. 12. 9.
티스토리 블로그 해킹 후 네이버, 다음의 검색노출은 ㅠㅠ 지난 4월 중순, 블로그에 이상한 댓글이 계속 달려서 매일 매일 삭제를 했었습니다. 어느날 제 블로그에 로그인이 안되어서 이래저래 알아보니 누간가 제 블로그를 해킹한 후에 도박사이트 소개 글을 올려서 티스토리로 부터 차단을 당한 것이었습니다. Daum에 전후 상황을 설명하는 메일을 보내고 답변을 받고 블로그에 다시 로그인 하기까지 대략 일주일 정도 소요되더군요. 로그인을 하여 접근경로를 찾아보니 중국에서 지속적으로 로그인을 한 것처럼 보입니다. 결국 제 계정의 비밀번호가 노출이 되었다는 것인데 어떻게 노출되었는지 아직도 이해가 안됩니다. 문제는 이렇게 블로그를 해킹당하고 난 후 복구를 해도 Daum이나 Naver에서 제 블로그 검색이 안된다는 것에 있습니다. 지난 몇년간 꾸준히 블로깅을 하여 하루에 적게.. 2013. 5. 23.
날씨와 트윗량의 관계 분석 몇몇 기사를 보면 미국은 구글의 검색량을 통해서 감기가 어떻게 퍼지고 있는지를 측정할 수 있다고 합니다. 감기증상이 나타나면 아무래도 검색을 통해 의약품 정보나 행동요령을 검색하기 때문에 관련 검색 트래픽이 증가할 것이고 그것을 분석하면 감기가 유행인지 아닌지를 알 수 있는 원리겠죠. 재미있을 것 같아서 짧게 국내 사례를 분석해 보았습니다. 최근 2개월에 대한 기온 변화와 "감기"가 포함된 트윗량의 변화를 살펴보면 어떤 상관관계가 나올까요? 아래 그림은 2013년 2월1일부터 4월10일까지 "감기"가 포함된 국내 트윗량의 변화 추세입니다.이를 보면 2월 7일과 8일 그리고 4월 2일에 트윗량이 급격히 증가한 것을 볼 수 있습니다. 그럼 2월 7일과 8일의 기온은 어떠했을까요?기상청(www.kma.go.k.. 2013. 4. 11.
지방포함 커피믹스 보도기사!! 판매에 영향을 줄까? 요며칠 사이에 커피믹스에 지방이 들어있다는 기사로 시끌시끌합니다. 지난 2월 14일에 서울대 식품영양학과 황금택 교수에 의해 발표된 연구결과 때문이죠. 커피믹스를 즐겨마시는 사람이면 누구나 한번쯤 커피믹스 안에 들어있는 프림에 지방이 있다는 "설"에 대해서 들어봤기 때문에 이번 발표가 크게 다가왔을 것입니다. 매체에서도 비슷한 기사를 며칠째 계속 재생산하면서 커피믹스에 지방이 들어있는 사실을 알리고 있습니다. 물론, 커피믹스의 넘버원인 동서식품에서는 지방함유량을 인정하면서도 그 양이 굉장히 작다고 발표를 했습니다. 꾸준히 기사를 양산하는 언론사와 이를 저지하는 회사! 결과는 어떻게 될까요. 온라인 및 지역언론사들이 꾸준히 해당 기사를 확대 재생산하고 있지만 트위터에서는 이미 관심이 사그라든 분위기입니다... 2013. 2. 18.
교촌, 네네, BBQ, 굽네치킨의 소비자 의견 분석 불금하면 떠오르는 대표적인 것이 치맥입니다. 지금은 한겨울이지만 더운 여름날 야외에서 즐기는 치맥의 맛은 정말 대단하죠. 치킨브랜드가 여러가지 있지만 현재 고객으로부터 많은 사랑을 받는 브랜드라 생각되는 유명 치킨브랜드(BBQ, 굽네치킨, 교촌치킨, 네네치킨)를 선발해서 몇가지 분석을 해 보았습니다. 분석기간 : 2013년 1월 1일~17일 분석내용 (1) 브랜드에 대한 선호도(2) 긍정 U-Story : 고객들은 각 치킨에 대해서 어떤 점을 좋게 생각하고 있는지?(3) 부정 U-Story : 고객들은 각 치킨에 대해서 어떤 점을 불편하게 생각하고 있는지? 그럼 하나씩 살펴보겠습니다. 먼저 BBQ 입니다. BBQ는 1995년에 런칭되었습니다. 벌써 약 19년 정도 되었네요. BBQ의 호감도는 긍정 77... 2013. 1. 18.
트위터 사용자의 지역/직업/성별/나이 분석 2탄 2011년 연말에 트위터 계정을 분석한 바 있습니다. 트위터 사용자의 지역/성별/직업 분석 포스트 보기 2012년에 트위터 계정도 많이 증가하였고, 지난 1년여동안 트위터 계정정보가 얼마나 변화되었는지 알아보고자 두번째로 트위터 사용자의 Location 및 Description을 분석해 보았습니다. 이번에 분석된 결과와 1년전의 데이터를 비교하면 변화량을 알 수 있을 것입니다. 분석대상은 버즈인사이트가 보유하고 있는 한글 계정 중에서 Location과 Description을 기술한 계정 1,154,751개를 대상으로 하였습니다. 그럼 하나씩 살펴보겠습니다. 1. 지역분포 대한민국으로 표시된 계정을 제외하고 보면 역시 서울이 38.82%로 가장 많고 그 다음이 경기도(11.23%), 부산(5.40%) 순입.. 2013. 1. 8.
무한도전과 런닝맨의 승자는 누구??? 각 방송사의 대표적인 예능프로그램은 무한도전(MBC), 1박2일(KBS), 런닝맨(SBS)입니다. 요즘 1박2일이 자리를 잡아가며 시청율이 조금씩 오르고 있다는 기사가 나오긴 했습니다만, 여전히 예능 대세는 유재석이 진행하는 무한도전과 런닝맨입니다. 브랜드분석서비스인 브랜드페어(http://www.brandfair.kr)를 이용하여 세 프로그램의 신뢰지수를 살펴보았습니다. 12월 29일에 살펴본 신뢰지수는 무한도전 > 런닝맨 > 1박2일의 순으로 무한도전의 점유율이 월등히 높습니다. 그러나, 최근 일주일의 추세를 보면 런닝맨과 무한도전이 1,2위를 다투고 있습니다. 평일에는 런닝맨이 앞서다가 주말이 다가올수록 무한도전이 앞서는 상황이네요. 2013년에는 1박2일의 분발을 기대해 봅니다. 2012. 12. 30.