Web Stats Data Mining 웹 통계 데이터 마이닝
September 22nd, 2008 · by David Bradley 2008년 9월 22일 데이비드 브래들리에 의해
What can online businesses learn from their web logs? 어떤 기업들은 웹 로그에서 온라인으로 배울 수 있습니까? According to 에 따르면 Xueping Li XuePing 리 of the Intelligent Information and Systems Laboratory, at the University of Tennessee, Knoxville, and colleagues, analyzing the information you can gather about the traffic to your website, whether that’s from raw access data on your server or standalone script-based systems such as Google Analytics, GetClicky, or Statcounter. 지능형 정보 및 시스템 연구실, 테네시 대학, 녹스빌, 및 동료의에서, 당신의 웹사이트의 트래픽에 대해 수집할 수 있는지에 원시 데이터에 액세스하여 서버 또는 독립형 스크립트에서 정보, - 기반의 시스템 분석 등 Google Analytics는 GetClicky, 또는 Statcounter.
As the Web has grown, so competition has intensified. 로서, 웹 성장했다, 그래서 경쟁이 심화하고있다. This is most certainly true among ecommerce sites with the likes of Amazon and Barnes & Noble vying for each other’s business just as intensely as news organizations battle for regular readers. 가장 확실한 사실이 아마존과 반즈 & 노블의 좋아하는 서로의 비즈니스에 대한 일반 독자를위한 뉴스 조직처럼 격렬하게 전투를 벌이고와 같은 전자 상거래 사이트 중 하나입니다. It is even true in the blogosphere where feedcount and post:comment ratios are apparently all important, despite the thin veneer of sociability among the A-listers. 그것도 블로그에이 사실이라면 어디 feedcount 및 게시물 : 덧글 비율은 분명히 중요한, 사교성의 한 가운데에도 불구하고 얇은 한척 - listers. Everyone wants more visitors and more interaction because that translates into sales one way or another, whether you are selling books, news, or your personal opinions. 여부 도서, 뉴스, 또는 귀하의 개인적인 의견을 팔고있는 모두들, 그 때문에 더 많은 방문자와 매출로 변환하거나 다른 방법은 하나 더 많은 상호 작용을 원한다.
This competition among businesses and the creation of an effective web presence is critical to attracting new customers/readers/community members and retaining current customers/readers/community members and so to the success of the business/community site/blog. 기업과 효과적인 웹 존재의 창출 간의 경쟁이 새로운 고객 / 리더 / 커뮤니티 회원 및 기존 고객을 유지 / 리더 / 커뮤니티 회원 및 비즈니스의 성공을 위해서는 유치 / 커뮤니티 사이트 / 블로그로 중요하다.
The features of a website such as its design and security and how it evolves over time influence whether a customer will revisit the site or make a transaction. 웹사이트의 디자인과 보안 그리고 시간이 지남에 어떻게 영향을 미치는 등 진화 여부는 고객 사이트를 찾아가야한다 또는 거래하게의 특징이다.
Li and colleagues have developed a way of looking at web logs so that webmasters can evolve their web sites to boost and retain visitors significantly. 리 및 동료 웹 보는 방법을 개발해야하므로 웹마 스터 크게 향상시키고 자신의 웹 사이트 방문자를 유지 진화할 수를 기록합니다. Their approach is based on what they describe as simple, yet effective descriptive statistical techniques that reveal the relationship between traffic workload and visitor domains names and geographic locations. 그들은 그들의 접근 방식으로 간단하게 묘사에, 아직은 통계적 기법을 설명하는 트래픽 워크로드 및 방문자의 도메인 이름과 지리적 위치 간의 관계를 밝힐 효과를 기반으로합니다. The regularities and patterns that emerge can shed light on how to design a better web site and enhance its performance. 이 regularities과 패턴을 그런식으로 더 나은 웹 사이트 디자인 및 성능 향상에 밝혀줄 수있는 사례다.
They point out that websites that remain unchanged for months or even years after their initial inauguration, cobwebs, you might call them, do with a few notable exceptions, lose their initial burst of customers very quickly. 그들은 그 변동 개월이나 남아도 세월을 초기 출범 후, 거미줄, 당신은 그들을 부를지도 웹사이트, 몇 가지 주목할만한 예외없이 매우 신속하게 고객들의 초기 버스트 잃게 지적이다. With the rapid growth of the web and intensified competition among businesses, creating and maintaining an effective web presence is a significant challenge. 웹 및 사업 자간 경쟁의 급속한 성장을 작성하고 효과적인 웹 존재를 유지하는 중요한 과제입니다. It is no coincidence that perhaps with some exceptions among the “essential” sites, successful websites tend to be those that are dynamic and whose information is the most sophisticated, diverse, and exciting. 그것은 ""필수 사이트 중 일부 예외없이 우연이 아니 아마도, 성공적인 웹사이트들을 그 누구의 정보를 동적하는 경향이 가장 다양한, 정교하고 흥미 롭군요.
But, there is no point in simply changing for the sake of it, if those changes are not informed by insight gleaned from current and past traffic and visitor interactions. 하지만, 그 변화를 통찰하는 경우에는 현재와 과거의 트래픽과 방문자의 상호 작용에서 모입로 통보하지 않습니다 단순히 그것의 이익을 위해, 변화에없는 대목이다. Of course, there is nothing new in suggesting that we check our stats and adapt our content and design to optimize for visitors. 물론, 거기에 우리의 방문자에 대한 통계를 확인하고 최적화하는 우리의 콘텐츠 및 디자인에 적응 제안에 새로운 것은 없다. However, the system described by Li and colleagues in their IJECRM publication (full reference below) explains how universal trends might be plucked from those stats. 그러나, 시스템은 리튬과 동료들의 IJECRM 간행물 (아래 전체 참조)에 설명되어있는 그 통계에서 뜯어낸있을 보편적인 경향을 설명하는 방법. Their proof of principle is based on sourced historical data, but they explain that there is no reason why a site should not do data mining on its live web stats and so become iteratively dynamic. 그들의 역사적 데이터에 기반한 증거를 원천 원칙이지만, 그들이 없다는 이유는 라이브 웹 사이트 통계에 그렇게 될 iteratively 동적 데이터 마이닝도하지 말라는 설명한다.
Xueping Li, Laigang Song, and Alberto Garcia-Diaz (2008). XuePing 리, Laigang 송, 그리고 알베르토 가르시아 - 디아즈 (2008). Adaptive web presence and evolution through web log analysis Int. 적응형 웹 존재와 진화를 통해 웹 로그 분석을 내장했다. J. Electronic Customer Relationship Management , 2 (3), 195-214 제이 전자 고객 관계 관리, 2 (3), 195-214




2 responses so far ↓ 반응이 너무 멀리 ↓
Hmm, intriguing. 흠, 흥미.
I’d have liked to have seen a little more detail about how these patterns work. 전에 대해 좀 더 자세하게 본 것 좋아했을 이러한 패턴이 어떻게 작동합니다.
That said, you have provided a link to the document, so I can always have a read later… 그거라면, 그래서 난 항상 저장을 읽을 수있는 문서에 대한 링크를 제공하고있다 ...
Yes, maybe I could splice in some additional information. 그래, 어쩌면 내가 몇 가지 추가 정보를 붙여서 수있습니다. Drop me a line if you’d like a PDF of the paper to do a follow up for blah. 드롭 날 선 신문의 경우 저쩌구에 대한 후속 조치 할 수있는 PDF 싶습니다.
Leave a Comment 코멘트를 남겨주세요