본 연구는 2009년부터 2018년까지 European Sport Management Quarterly(ESMQ)에서 발간된 논문들의 주제를 분석하는데 목적이 있다. ESMQ에 대한 주제분석이 전무했던 것은 아니지만 실제 어떠한 연구가 이루어지고 있는지에 대한 분석이라기보다는 NASPE-NASSM SMPS를 바탕으로 설정한 주제에 각 논문들을 할당하는 방식으로 주제분석이 이루어졌다.
본 연구에서는 단어들이 어떤 단어들과 함께 사용되고 있는가를 바탕으로 주제를 추출하는 Latent Dirichlet Allocation(LDA)기반의 토픽모델링(topic modeling)을 이용하여 분석하였다. 이를 위해 PDF파일로 확보한 265개의 논문을 ANSI 형식의 Text File로 변환 시켰으며 분석은 R 프로그램의 스크립트를 이용하였고 topic 수는 10개로 설정하였다.
10개로 분류된 논문들을 Gamma 수치가 높은 순으로 재정렬하여 각각의 주제를 명명하는데 기준을 삼았는데 각각의 주제는 (1) Impact of mega sport event, (2) Cause-related marketing, (3) Factors affecting the results of the competition, (4) Managing sport organization, (5) European sport leagues, (6) Strategic management, (7) Sport economics, (8) Sport in communities, (9) Sport consumers, (10) Elite sports로 명명되었다. 선행연구의 분류기준과 본 연구의 분류기준이 다르기 때문에 두 개의 연구를 직접적으로 비교하는 것은 불가능하다. 하지만 분류기준이 다름에도 불구하고 Sport marketing 주제 영역은 여타의 주제들에 비해 가장 큰 양적 성장이 있던 연구주제인 것으로 나타났다.
객관적이고 명확한 주제분석을 위하여 LDA 확률모델 알고리즘의 토픽모델링 기법이 적용되었으나 연구자의 통찰력은 여전히 필요하였다. 이에 향후 연구에서는 다양한 토픽 수로 분석하여 비교하거나 데이터의 전처리 여부에 따른 주제 추출 결과 비교를 통해 주제분석의 객관성 확보에 근거가 되기를 기대한다.
The purpose of this study was to analyze the research topics of the articles which were published through European Sport Management Quarterly(ESMQ) from 2009 to 2018. The prior topic analysis studies of the ESMQ classified topics based on the key words using NASPE-NASSM SMPS categories. Therefore they couldn't fully reflect the content of the articles.
The topic modeling of the current study was conducted with the Latent Dirichlet Allocation(LDA) which generates topics based on the word usage in the article. A total of 265 articles were converted from 'pdf' format to 'txt' ANSI format for topic modeling analysis. The whole topic modeling process was done using R program and the model was set to generate 10 topics from the article.
The 3 sport management experts were hired to label the name of the topics and the name of the topics are as follow : (1) Impact of mega sport event, (2) Cause-related marketing, (3) Factors affecting the results of the competition, (4) Managing sport organization, (5) European sport leagues, (6) Strategic management, (7) Sport economics, (8) Sport in communities, (9) Sport consumers, (10) Elite sports. It is not quite possible to compare the results of the current topic modeling results with the previous ones because of the methodological differences. However, even though the standards are different, Sport marketing topic showed the largest growth among the 10 topics extracted.
This study used the LDA probabilistic algorithm to analyze research topics, which made the analyses more objective and wholistic. However, the insights of the researchers were still needed to interpret and labeling the topics.
스포츠 산업의 발달과 함께 스포츠 경영의 학문적 발전을 촉진하기 위하여 다양한 학회가 형성되었고 그 학회에서는 연구의 발전을 위한 노력의 일환으로 학회지를 발간하기 시작하였다. 세계 스포츠 산업의 한 축으로 인식되고 있는 유럽에서는 1992년에 처음으로 학회(European Association for Sport Management, EASM)가 설립되었다. 이후 1994년부터 EASM에 의해 European Journal for Sport Management(EJSM)가 발간되기 시작하였고 그 저널은 현재 European Sport Management Quarterly(ESMQ)로 명칭이 바뀌었다. ESMQ는 유럽과 관련된 연구뿐만 아니라 스포츠 경영에 대한 여러 측면을 서로 다른 문화적, 지역적 관점으로 연구한다는 학문적 철학을 보유하고 있다(
ESMQ는 스포츠 경영 전문 학술지로서 인정받고 있으며 학술지에 게재되는 논문들이 스포츠 경영학 분야를 잘 반영하고 있는 것으로 평가되고 있다. 이는 1,565개의 경영관련 학술지를 분석한 Academic Journal Guide 2018에서 확인 할 수 있다(
연구자들은 ESMQ에서 발간된 논문들에서 자주 참고 되고 있는 학술지가 어느 것인지(
ESMQ의 주제분석을 다룬 선행연구의 또 다른 약점은 자료 분석 시에 적용한 분류 기준에 대한 부분이다. 예를 들어
선행연구에서 이러한 약점들이 나타나는 것은 출판된 연구들의 내용을 전체적으로 파악하고 이 연구들을 분류 한 것이 아니라, 주제 리스트를 미리 정해놓고 각 연구들의 제목, 초록 혹은 주제어를 바탕으로 각 주제에 할당하는 방식을 사용하기 때문이다. 이러한 선행연구들에서 나타난 약점을 보완하기 위해서는 방대한 양의 논문들의 전문 안에 내제된 정보들의 연관성을 파악해 내어 논문들이 가지고 있는 경향에 따라 분류하는 분석방법이 요구된다. 이러한 요구를 충족시키는 분석방법으로 토픽 모델링(topic modeling)이라는 새로운 분석기법이 사용되고 있다. 토픽 모델링은 문서 안에 들어 있는 텍스트들의 의미구조를 발견하기 위해 사용되는 텍스트 마이닝(text mining) 기법 중에 하나이다. 이 기법은 컴퓨터 알고리즘을 통해 논문에 등장하는 단어들의 분포를 파악하여 논문 내에 어떠한 주제가 들어 있으며, 주제들의 비중이 어떠한지 등을 객관적으로 제시해준다(
다수의 스포츠 경영 전문 학술지 중에서 유럽을 대표하는 학술지로 ESMQ가 있다면 북미를 대표하는 학술지로는 Journal of Sport Management(JSM)가 존재한다. ESMQ와 JSM은 스포츠경영학에서 대표적인 저널이면서 각 대륙을 대표하는 학술지로 인정받고 있다. 예를 들어 JSM은 스포츠 경영 학술지들 가운데 가장 친숙한 학술지로 인식되고 있으며 학술지의 품질 평가에서 가장 높은 점수를 기록했고(
이렇다 보니 각 대륙을 대표하는 JSM과 ESMQ를 통해서 어떠한 논문들이 발표되고 있는지에 대한 학자들의 관심이 있어왔다. 그중에서 JSM에 대한 종합적인 주제분석은
본 연구의 분석 대상인 ESMQ에 대해 가장 최근에 이루어진 종합적인 주제 분석은
본 연구에서는 2009년부터 2018년까지 ESMQ에서 발행된 논문들이 사용되었다. 이 기간 동안 발행된 각 호에는 Editorial, Keynote address 등 다양한 유형의 글들도 존재한다. 하지만 본 연구의 목적이 논문들의 연구 주제를 파악하는데 있기 때문에 Article로 구분된 연구논문들만 사용되었다. 온라인 데이터베이스를 통해 전체 265개의 논문이 PDF 형식의 파일로 수집되었다. 자료를 PDF 형식의 파일로 저장할 때 논문이 발행된 권과 호 그리고 저자명을 파일의 이름으로 지정하여 자료가 누락되거나 이중으로 수집되는 것을 방지하였다. 이렇게 수집된 자료는 분석을 위해 R 프로그램을 통해 ANSI 형식의 Text File로 변환되어 사용되었다.
참고문헌만을 이용하여 주제분석을 한 선행연구가(
본 주제 분석에는 여러 주제가 혼합된 문서 분석에 가장 적절한 방법으로 알려진 Latent Dirichlet Allocation(LDA)기반의 Topic Modeling 방법이 사용되었다. 일반적으로 LDA를 이용한 주제 분석을 위해 연구자의 판단에 따라 stopwords가 적용된다. 하지만 본 연구에서는 학술지에서 보이는 특징을 확인하기 위하여 연구자가 별도로 선정한 stopwords를 적용하지 않았다. 다만 특수문자, 구두점, 숫자, 텍스트간의 여백을 삭제하는 과정을 거쳐 알파벳만을 남겨 두었고 모든 글자를 소문자로 변환하였다. 또한, 명확한 주제 분석의 도출을 위하여 어간이 같고 어미가 틀린 단어들이 다른 단어로 분류되지 않도록 tm_map(docs, stemDocument)을 사용하였다. 이로 인해 주제 분석 결과에 단어의 전체 스펠링이 제시되지 않는다.
토픽 모델링에서 토픽수의 선택은 일종의 렌즈 선택과 유사한 것으로 비유되는데 소수의 토픽수를 지정하여 주제를 망원렌즈처럼 볼 수 있으며 토픽수를 많이 지정하여 세밀히 들여다보는 현미경처럼 분석할 수 있다(
R 스크립트를 이용한 분석절차에 따라 4개의 CSV파일을 생성하였다. word_freq 파일은 분석한 문서 전체에서 사용빈도가 가장 높은 단어부터 제시해주는 것으로 단어의 사용빈도가 높다는 것은 해당 단어가 주제 분석에 미치는 영향이 크다는 것을 의미한다. TopicToTerms 파일은 추출된 10개의 주제를 대표하는 단어를 주제별로 10개씩 제시해주며 DocsToTopics 파일은 각각의 논문들이 어떤 주제에 해당하는지 구분하여 준다. 그리고 TopicProbabilities 파일은 각각의 논문들이 10개의 주제와 얼마만큼의 관계가 있는지를 보여주는 Gamma 수치를 제시해 준다.
각 주제별 명칭을 정하는 과정에는 JSM의 논문에 대한 주제 분석 경험이 있는 스포츠경영 국내외 교수 2명과 박사과정의 2인이 참여하였다. 명명의 과정에서는 각 주제별로 제시된 대표 단어 10개와 Gamma수치가 가장 높은 상위 5개의 논문의 주제가 사용되었다. 먼저 박사과정의 2인이 Gamma와 빈도수가 높은 단어를 기초로 하여 주제에 대한 명명을 하였고 이를 국내 스포츠 경영 교수가 수정을 하였다. 이 결과는 국외의 스포츠경영 교수에게 전달되어 최종으로 주제에 대한 명명이 이루어졌다.
ESMQ는 2009년부터 2015년까지 평균 24.3편의 논문을 발행하다가 2016년부터는 평균 32편이 발행 되었다. 발행된 개별 논문들이 어떠한 주제로 나눠지는지 분류하였는데 연구가 특정한 주제로 집중되는 현상은 발견되지 않았다. 다만 2010년에는 9편의 논문이 Topic 4로 분류되어 그 해 출판되어진 25편의 논문에서 연구자들에게 가장 관심을(36.0%) 받은 연구 주제인 것으로 나타났다. Topic 4는 연구자에게 꾸준히 관심을 받은 주제이며 Topic 3과 Topic 8, Topic 9 역시 10년간 단 한 번도 빠지지 않고 출판되어온 주제이다<
2009 | 2010 | 2011 | 2012 | 2013 | 2014 | 2015 | 2016 | 2017 | 2018 | |
---|---|---|---|---|---|---|---|---|---|---|
Topic 1 | 2 | 2 | 4 | 5 | 3 | 2 | 7 | 1 | 1 | - |
Topic 2 | - | 1 | - | 2 | 3 | 3 | 2 | 7 | 3 | 2 |
Topic 3 | 5 | 1 | 1 | 2 | 1 | 1 | 2 | 2 | 2 | 2 |
Topic 4 | 5 | 9 | 3 | 3 | 4 | 4 | 5 | 2 | 5 | 3 |
Topic 5 | 1 | 3 | 1 | 2 | 2 | 3 | - | 6 | 5 | 4 |
Topic 6 | 3 | 3 | 2 | - | 2 | 3 | 3 | 2 | 1 | 4 |
Topic 7 | 4 | 2 | 3 | 3 | - | 2 | 1 | 3 | 2 | 1 |
Topic 8 | 1 | 3 | 3 | 2 | 6 | 1 | 1 | 4 | 2 | 3 |
Topic 9 | 1 | 1 | 3 | 3 | 4 | 6 | 1 | 3 | 5 | 9 |
Topic 10 | 1 | - | 1 | 3 | - | 1 | 3 | 2 | 5 | 4 |
23 | 25 | 21 | 25 | 25 | 26 | 25 | 32 | 31 | 32 |
자료의 주제분석을 위한 과정 중에 제일 먼저 생성되는 word_freq 파일에는 전체 분석대상 논문에서 사용된 단어들의 빈도수를 제시해준다<
word | frequency | word | frequency | word | frequency | word | frequency | word | frequency |
---|---|---|---|---|---|---|---|---|---|
sport | 25,993 | model | 4,460 | data | 3,166 | find | 2,561 | inform | 2,304 |
team | 8,535 | level | 4,445 | organis | 3,055 | involv | 2,559 | interest | 2,251 |
event | 7,821 | valu | 4,204 | process | 3,032 | high | 2,557 | competit | 2,220 |
studi | 7,698 | athlet | 3,937 | increas | 3,001 | influenc | 2,556 | exampl | 2,210 |
particip | 6,712 | posit | 3,912 | footbal | 2,893 | ommuniti | 2,525 | mean | 2,199 |
research | 6,099 | group | 3,869 | olymp | 2,832 | specif | 2,523 | profession | 2,196 |
manag | 5,902 | import | 3,671 | includ | 2,831 | member | 2,514 | chang | 2,194 |
club | 5,654 | may | 3,653 | market | 2,810 | structur | 2,485 | identifi | 2,191 |
use | 5,639 | activ | 3,650 | relationship | 2,807 | nation | 2,481 | will | 2,185 |
can | 5,255 | perform | 3,649 | govern | 2,793 | associ | 2,471 | suggest | 2,169 |
organ | 5,049 | fan | 3,539 | base | 2,789 | work | 2,471 | context | 2,143 |
social | 4,981 | volunt | 3,534 | consum | 2,760 | measur | 2,470 | perceiv | 2,127 |
differ | 4,946 | support | 3,475 | year | 2,745 | leagu | 2,463 | follow | 2,119 |
also | 4,791 | provid | 3,462 | howev | 2,716 | role | 2,427 | toward | 2,111 |
develop | 4,767 | signific | 3,439 | player | 2,664 | brand | 2,399 | like | 2,109 |
effect | 4,696 | individu | 3,327 | tabl | 2,653 | experi | 2,377 | term | 2,101 |
game | 4,658 | factor | 3,318 | impact | 2,649 | new | 2,367 | peopl | 2,095 |
relat | 4,646 | two | 3,293 | first | 2,605 | indic | 2,341 | need | 2,067 |
one | 4,536 | variabl | 3,281 | analysi | 2,596 | focus | 2,336 | servic | 2,053 |
result | 4,494 | time | 3,270 | within | 2,565 | number | 2,332 | attitud | 2,050 |
다른 파일은 10개의 주제로 논문들을 분류할 때 어떠한 기준으로 분류하였는지에 대한 근거를 단어로 제시하여준다<
Topic | n | words |
---|---|---|
1 | 27 | event, olymp, game, host, impact, resid, social, legaci, citi, local |
2 | 23 | brand, sponsor, sponsorship, attitud, consum, toward, team, imag, studi, athlet |
3 | 19 | player, team, coach, perform, match, dope, use, stage, haze, fix |
4 | 43 | sport, manag, organis, research, process, develop, structur, knowledg, within, can |
5 | 27 | team, leagu, footbal, club, season, match, variabl, market, attend, effect |
6 | 23 | organ, club, sport, manag, govern, board, member, profit, financi, organiz |
7 | 21 | sport, particip, activ, variabl, model, time, age, level, studi, differ |
8 | 26 | volunt, social, communiti, sport, group, particip, work, member, team, individu |
9 | 36 | sport, fan, team, valu, studi, item, model, research, factor, game |
10 | 20 | sport, athlet, elit, perform, develop, nation, coach, countri, polici, support |
TopicProbabilities 파일에 제시된 Gamma 수치가 높을수록 주제와 관계가 높은 논문이다. 따라서 주제별로 Gamma 수치가 높은 상위 5개의 논문을 각각의 주제를 대표하는 논문으로 선정하였다<
Topic | Gamma | Assigned article |
---|---|---|
Impact of mega |
0.84 | Legacy perceptions among host and non-host Olympic Games residents: a longitudinal study of the 2010 Vancouver Olympic Games |
0.82 | The importance of legacy outcomes for Olympic Games four summer host cities residents' quality of life: 1996-2008 | |
0.78 | The Social Impact of the Tour de France: Comparisons of Residents’ Pre- and Post-event Perceptions | |
0.72 | Legacy of the Beijing Olympic Games: a non-host city perspective | |
0.67 | Residents’ Perceptions of Environmental Impacts of the 2008 Beijing Green Olympic Games | |
Cause-related |
0.86 | Ending a sponsorship relationship: consumers’ responses toward a forced versus a chosen exit |
0.85 | The impact of processing athlete transgressions on brand image and purchase intent | |
0.78 | Exploring the impact of country-of-origin fit and team identification in sports brand evaluation | |
0.73 | Cause-related marketing in sports: the power of altruism | |
0.71 | Cause-related sport marketing: an organizing framework and knowledge development opportunities | |
Factors affecting |
0.78 | A study of efficiency monitoring systems for match-fixing players in the Chinese Professional Baseball League |
0.77 | Tie-breaking in round-robin soccer tournaments and its influence on the autonomy of relative rankings: UEFA vs. FIFA regulations | |
0.75 | Case Law Analysis Regarding High School and Collegiate Liability for Hazing | |
0.71 | The effect of strategic resting in professional cycling: evidence from the Tour de France and the Vuelta a Espana | |
0.63 | Payback Calls: A Starting Point for Measuring Basketball Referee Bias and Impact on Team Performance | |
Managing sport |
0.81 | Culture and the Study of Sport Management |
0.79 | Embracing Cultural Contexts and Critical Reflexivity: (Re)presenting the Global Sports Industry in Research and Practice | |
0.75 | Navigating austerity: balancing ‘desirability with viability’ in a third sector disability sports organisation | |
0.75 | Creating and leveraging knowledge to promote sport participation: the role of public governing bodies of sport | |
0.74 | Stakeholder Constructions of Leadership in Intercollegiate Athletics |
Topic | Gamma | Assigned article |
---|---|---|
European |
0.88 | Fan preferences: one country, two markets and different behaviours |
0.88 | Analysing match attendance in the European Rugby Cup: Does uncertainty of outcome matter in a multinational tournament? | |
0.85 | The lack of balance in the Spanish First Division football league | |
0.85 | Can sporting success in Norwegian football be predicted from budgeted revenues? | |
0.83 | The Beckham effect: examining the longitudinal impact of a star performer on league marketing, novelty, and scarcity | |
Strategic |
0.88 | Growth determinants of small- and medium-sized fitness enterprises: empirical evidence from Portugal |
0.74 | Corporate governance and earnings management in the European football industry | |
0.70 | Organizational performance of nonprofit and forprofit sport organizations | |
0.69 | A structural perspective of cross-sector partnerships involving youth sport nonprofit organizations | |
0.66 | A model of transparency: determinants and implications of transparency for national sport organizations | |
Sport |
0.92 | The Demand for Sports and Recreational Services: Empirical Evidence from Germany |
0.92 | Travel Time Spending Behaviour in Recreational Sports: An Econometric Approach with Management Implications | |
0.92 | The determinants and income elasticities of direct and indirect sports expenditure categories | |
0.89 | An examination of the determinants of Irish household sports expenditures and the effects of the economic recession | |
0.88 | Expenditures on Sport Apparel: Creating Consumer Profiles through Interval Regression Modelling | |
Sport in |
0.78 | Sunday afternoon social capital: an ethnographic study of the Southern City Jets Club |
0.76 | Creating Communities that Lead to Retention: The Social Worlds and Communities of Umpires | |
0.70 | Changing roles: applying continuity theory to understanding the transition from playing to volunteering in community sport | |
0.68 | The Value of the Dark Side: An Insight into the Risks and Benefits of Engaging in Health-compromising Practices from the Perspective of Competitive Bodybuilders | |
0.64 | ‘You belonged to something’: exploring how fundraising teams add to the social leverage of events | |
Sport |
0.92 | The relative effects of game outcome and process on fans’ media consumption experiences |
0.88 | Psychometric Evaluation of the Team Identification Scale among Greek Sport Fans: A Cross-validation Approach | |
0.85 | Managing dive centres: SCUBA divers' behavioural intentions | |
0.85 | The effects of emotions on football spectators' satisfaction and behavioural intentions | |
0.85 | Impact of core and peripheral service quality on consumption behavior of professional team sport spectators as mediated by perceived value | |
Elite |
0.84 | Positioning in Olympic Winter sports: analysing national prioritisation of funding and success in eight nations |
0.84 | Global Trade in Sports Goods: International Specialisation of Major Trading Countries | |
0.74 | A psycho-educational curriculum for sport career transition practitioners: development and evaluation | |
0.71 | Exploring China's success at the Olympic Games: a competitive advantage approach | |
0.69 | Coach migration in German high performance sport |
Topic 1에는 265개 문서 중 27개 문서(10.2%)가 할당되었으며, 주요 단어로는 ‘event’, ‘olympic’, ‘impact’, ‘legaci’등이 선정되었다. 할당된 논문의 내용과 주요 단어를 바탕으로 Topic 1은 “Impact of mega sport event”로 명명하였다.
Topic 2에는 ‘brand’, ‘sponsor’, ‘attitud’ 등의 단어가 선정되었다. 선정 단어와 관련 논문 내용의 큰 줄기는 스포츠마케팅으로 그 중에서도 스폰서십 등의 활동이 브랜드에 미치는 영향이 집중적으로 나타났다. 특히 기업이나 브랜드를 사회적 명분이나 이슈에 전략적으로 연계시키는 Cause-related marketing 관련 논문이 두 개나 포함되었다. 이에 따라 스포츠마케팅의 중요 부분인 “Cause-related marketing”으로 Topic 2를 규정하였다.
Topic 3으로 도출된 논문들 중 가장 높은 Gamma 수치를 보인 5개의 논문은 모두 경기의 수행수준에 영향을 줄 수 있는 변인들에 대한 연구로 대표될 수 있었다. 그 요인이 팀내의 요인(i.e., hazing), 제도의 요인 (i.e., round robin), 작전(i.e., strategic resting), 심판, match fixing으로 다양하게 제시되었지만 결국 이 요인들은 경기결과나 경기 수행 수준을 결정짓는 요인들로 분류되어질 수 있었다. 따라서 본 주제는 “Factors affecting the results of the competition”으로 명명 되었다.
Topic 4에는 10개의 토픽 중 가장 많은 문서인 43개(16%)가 할당되었다. 이와 관련된 단어로는 ‘manag’, ‘organis’ 등 스포츠 경영 연구에서 공통적으로 들어갈 수 있는 단어가 상위에 나타났다. Gamma 수치가 높은 상위 다섯 개의 논문에서는 ‘culture’, ‘balancing’, ‘leadership’ 등 스포츠조직의 운영과 관련된 내용들이 포함되었다. 이에 따라 본 주제는 “Managing sport organization”으로 명명되었다.
Topic 5에는 ‘team’, ‘leagu’, ‘club’ 등의 단어가 상위에 도출되었으며, 관련 논문에서도 ‘European Rugby Cup’, ‘Spanish First Division football’, ‘Norwegian football’ 등 유럽 국가의 스포츠 리그에 대한 내용이 주를 이루었다. 이와 같은 특성을 반영할 수 있도록 본 주제는 “European sport leagues”로 명명되었다.
Topic 6에는 ‘organ’, ‘club’, ‘govern’, ‘profit’ 등의 단어가 선정되었으며 관련 논문에서도 조직경영에 대한 내용이 주를 이루고 있었다. 또한 다섯 개의 논문이 ‘earnings’, ‘performance’, ‘transparency’, ‘structure’, ‘growth’ 등의 주제어를 포함하면서 조직 운영의 전략적인 부분을 다루고 있는 측면을 반영하여 “Strategic management”로 명명하였다.
Topic 7에서는 ‘particip’, ‘activ’ 등의 단어들이 출현 빈도가 높은 단어로 나타났다. 그러나 Gamma 수치가 높은 상위 5개의 논문의 제목에서는 상당히 일관되게 스포츠와 관련된 지출에 대한 내용이 포함되어있었다. 다섯 개의 논문에서는 레크리에이션에 대한 지출, 스포츠 의류에 대한 지출 등 다양한 지출의 대상이 존재한다. 하지만 같은 주제로 묶인 다른 16개의 논문들을 확인한 결과 개인의 지출에 관련된 내용과 공적 지출에 관한 내용들이 혼재 되어 있는 것으로 나타났다. 따라서 이를 모두 아우를 수 있도록 “Sport economics”으로 주제에 대한 명명을 결정하였다.
Topic 8에는 ‘volunt’, ‘social’, ‘communiti’ 등의 단어가 출현빈도가 높은 단어들로 선정되었다. 관련 논문의 대부분에서 지역 사회와 관련된 내용들이 포함되어있었다. 다만 Gamma 수치가 네 번째로 높은 논문의 제목이나 내용이 다른 논문들과의 연관성이 상당히 떨어지는 것으로 나타나 이 주제에 대한 명명을 혼란스럽게 하였다. 본 연구에 참여한 전문가 4인 모두 4번째 논문을 본 주제와 관련이 떨어진다는 판단을 하였고 주제에 대한 명명에 이 논문의 내용을 반영하지 않기로 결정을 하였다. 따라서 본 주제는 “Sport in communities”로 명명 되었다.
Topic 9에서는 ‘fan’, ‘team’, ‘factor’ 등의 단어가 높은 출현빈도를 보였다. Gamma 수치가 높은 다섯 개의 논문에서는 관람 스포츠의 소비자인 팬들의 행동에 대한 내용이 주를 이루고 있었다. 하지만 Gamma 수치가 세 번째로 높은 논문의 경우에는 관람 스포츠의 소비자가 아닌 참여 스포츠 소비자의 행동에 관련된 논문이어서 관람스포츠 소비자로 한정지어 주제를 명명하기는 애매한 면이 존재하였다. 추가적으로 Gamma 수치가 6위에서 10위에 있는 논문들의 제목을 점검한 결과 관람스포츠 팬의 내용과 참여스포츠 소비자의 내용이 혼재한 것을 확인하였다. 따라서 본 주제는 “Sport consumers”로 명명하였다.
Topic 10은 ‘athlet’, ‘elit’, ‘perform’, ‘coach’ 등의 단어들이 출현 빈도가 높은 단어로 선정되었다. Gamma 수치가 높게 나타난 상위 다섯 개의 논문들의 주요 주제 또한 엘리트 스포츠와 관련된 제목들이었다. 또한 두 번째 논문을 제외한 네 가지 논문의 내용이 주로 높은 경기 수행력과 경쟁력 확보에 관한 내용으로 이루어진 것을 확인할 수 있다. Gamma 수치가 높은 상위 다섯 개의 논문 중 두 번째 논문의 제목이 다른 네 개의 논문과는 유사성을 보이고 있지 않아 논문의 내용을 확인하였다. 두 번째 논문의 내용은 스포츠 용품과 관련된 국제 무역과 관련해서 미국, 유럽 및 신흥국가들의 전문성을 다룬 논문이었다. 본 연구에 참여한 4인의 전문가 모두 본 연구의 주제가 전문적인 스포츠와 관련된 장비, 스포츠 상품에 관한 내용도 포함하고 있어서 함께 분류된 논문들과 전혀 다른 주제는 아니라는 것에 의견이 모아졌다. 이에 따라 10번째 주제는 “Elite sports”로 명명 되었다.
본 연구에서는 스포츠 경영 전문 학술지 중에서 세계적으로 높은 인용지수를 유지하고 있으며 대표 학술지로 인정받고 있는 ESMQ의 연구 주제를 분석 하였다. 분석에 있어서
먼저 ESMQ에 사용된 주제들의 구조적인 분석에 대한 논의를 하고자 한다. 논문이 발행된 년도를 기준으로 각각의 주제들이 몇 편씩 발행되었는지 확인하였는데 2014년, 2016년과 2017년 총 3개년을 제외 하고는 모든 주제들이 빠짐없이 연구되지는 않았던 것으로 나타났다. 3개년에는 모든 주제가 연구되었지만 2014년에는 Sport consumers와 관련된 논문이 6편(23.1%)으로 가장 많이 발행되었고 2016년에는 Cause-related marketing이 7편(21.9%), European sport leagues가 6편(18.9%) 씩 발행된 것으로 나타나 연구자들의 관심을 더 많이 받은 주제인 것으로 보인다.
발행된 연도별로 특별히 많은 논문편수가 분배되지는 않았지만 연구자들에게 꾸준히 다뤄져온 주제도 존재한다. 3번째 주제로 명명된 Factors affecting the results of the competition, 4번째 주제로 명명된 Managing sport organization, 8번째 주제로 명명된 Sport in communities와 9번째 주제로 명명된 Sport consumers 총 네 개의 주제인데 ESMQ의 저자들은 이 네 개의 주제에 대한 연구를 상당히 지속적으로 해 온 것으로 나타났다. 이러한 현상은 북미를 거점으로 하고 있는 Journal of Sport Management와 약간의 차이를 보이는 것으로 나타났다. JSM의 경우에는 스포츠 조직에 대한 연구와 스포츠 관람객(i.e., Fan) 을 대상으로 한 연구는 꾸준히 제시되고 있지만 Factors affecting the results of the competition과 Sport in communities는 꾸준한 관심을 보이는 주제는 아닌 것으로 나타났다.
하지만
상술한 Management & organizational skills in sport 주제영역과 Sport marketing 주제영역은 최근에 보고된 JSM에 대한 주제 분석 결과와 비슷 경향을 보인다(
이밖에도 ESMQ와 JSM의 연구 주제분석 결과 중에는 ESMQ의 Elite sports(n=20, 7.5%)와 JSM의 Professional sports(n=43, 11.7%)와 같이 비슷한 주제들이 있다. 이는 두 개의 학술지가 스포츠 경영 전문지라는 공통분모를 가지고 있기 때문으로 여겨진다. 물론 ESMQ에 대한 본 연구결과와 JSM(
이렇게 선행연구 결과와 본 연구결과의 유사점 그리고 다른점 들을 제시하였는데, 본 연구결과에 따라 제시된 주제들은
본 연구는 연구의 대상으로 ESMQ에 출판된 논문들을 사용하였고 이 논문들은 아무래도 출판의 지리적 기원인 유럽지역의 스포츠산업과 현상을 반영하는 연구들이 많이 포함되었다. 따라서 본 연구에서 나타난 연구의 트랜드나 주제에 대한 관심을 우리 국내 학자들도 같은 정도로 갖아야 한다는 주장은 딱히 큰 의의가 있다고 판단되지는 않는다. 다만 본 연구에 대한 주제분석의 내용이 국내에서 이루어지고 있는 스포츠경영과 어떤 주제적 유사성 혹은 주제적 차이점이 있는 지는 아직 정확하게 비교하기가 어렵다. 아직 국내의 스포츠경영 관련 논문들을 토픽모델링을 사용하여 분석한 연구가 없다보니 본 연구의 결과와 비교해서 설명될 사전연구가 존재하지 않는다. 따라서 국내 스포츠경영에 대한 주제분석의 연구에 있어서도 기존의 주제분석 방식을 벗어나 텍스트마이닝의 기술이 적용이 된 주제분석이 이루어 진다면 기존에 이루어진 북미대륙의 JSM에 대한 토픽모델링이나 ESMQ에 대한 토픽모델링의 결과가 직접적으로 같이 비교될 수 있을 것이다.
본 연구에서는 2009년부터 2018년 사이에 ESMQ를 통해 발간된 논문들에서 연구자들에게 중요하게 다뤄지는 연구 주제들이 무엇인지를 확인하고자 하였다. 이를 위해 토픽모델링 기법을 사용하여 주제분석을 수행하였는데 기존에 수행되었던 연구와 다른 구조의 결과가 제시되었다. 이 같은 결과는 분석방법의 차이에서 기인한 것으로 볼 수 있다. 선행연구에서는 NASPE-NASSM SMPS를 바탕으로 설정한 주제에 각 논문들을 할당하는 방식으로 분석하였고 본 연구는 맥락과 관련된 단서들을 이용하여 해석가능성이 높은 주제를 추출해주는 특성을 가진 LDA 확률모델 알고리즘의 토픽모델링 기법이 적용되었다. 즉, 선행연구에서는 사전에 정의된 범주에 의해 분류되었고 본 연구에서는 토픽의 숫자만 정해서 분류하였다.
바로 이점이 선행연구와 본 연구의 가장 다른 점이다. 선행연구가 적용한 분류방법은 ESMQ에 NASPE-NASSM SMPS의 주제들이 몇 편씩 발행되었는지를 확인한 것이지 ESMQ에서 실제로 어떠한 연구주제들이 다뤄지고 있는지 분석되었다고 보기 어렵다. 뿐만 아니라 선행연구에서 적용되어진 분류방법은 연구자의 통찰력에 의존한 분석으로 타당성 확보에 제한점을 가질 수밖에 없다. 물론 이러한 제한점을 최소화하기 위하여 코더 간에 사전에 정의된 코드 혹은 의미 범주를 설정하지만 타 연구자에 의한 재생가능성의 문제점을 완전히 해결하지는 못한다.
하지만 토픽모델링을 통한 주제분석도 객관성에 대한 상대적 약점을 지니고 있다. 자동으로 분류되어 추출된 단어들과 10개의 묶음으로 분류된 논문들 그리고 그 논문들이 주제와 얼마만큼 깊은 관계가 있는지 나타내 주는 Gamma 수치를 바탕으로 주제들을 명명하는 과정에서 연구자의 통찰력이 요구되었다. 특히 같은 주제로 묶인 논문 중에서 여타의 논문들과 개연성이 낮다고 판단되는 논문에 대한 해석은 전문가들의 식견에 의존하였다. 이처럼 LDA 알고리즘이 갖는 특성이 분석 대상인 논문들에 대한 사전 지식이 많이 요구되지 않고도 주제분석이 가능하다는 것이지만 때때로 논문이 갖는 의미를 이해하기 위한 추가적인 노력이 필요하였다. 사실 이 과정에서 요구되는 전문가의 식견은 토픽모델링을 통한 주제분석 연구에서 공통적으로 발견되고 있다.
향후 연구에서는 좀 더 명확한 주제 추출을 위하여 토픽 수를 다양하게 설정할 필요가 있다. 본 연구에서는 분석의 용이성과 일반적으로 주제분석을 하는 연구에서 선정하는 토픽의 수를 고려하여 10개의 토픽으로 주제분석을 수행하였다. 즉, 한가지의 렌즈만을 사용하여 ESMQ에서 발행된 논문들을 들여다 본 것인데, 향후 연구에서는 토픽의 수를 두 가지 이상으로 설정하여 두 개 이상의 렌즈로 들여다본다면 전문가에 의해 명명된 주제에 타당성이 확보될 것이라 판단된다.
본 연구에서는 명확한 주제 추출을 위하여 자료 전처리 과정에 많은 시간이 투자 되었다. 265개의 PDF파일을 Text File로 변환한 후 참고문헌과 반복적으로 삽입되어 있는 학술지명, 저자명 등을 수작업으로 삭제하였다. 이는 순수하게 논문만을 대상으로 분석하기 위한 목적이었다. 하지만 LDA는 단순히 단어의 빈도만으로 주제가 추출되는 것이 아니고 문서 내에서 어떠한 단어와 함께 사용되었는지가 고려되는 알고리즘이다. 따라서 순수하게 논문만을 대상으로 주제를 추출하는 것과 참고문헌뿐만 아니라 문서내의 기타 Text들을 제거 하지 않고 주제를 추출하는 경우를 비교 분석하는 연구 혹은 연구자가 선정한 Stopwords를 적용하여 주제를 추출하는 연구가 진행된다면 향후 LDA를 사용하여 주제 분석을 하는 연구자들에게 명확한 주제추출을 위한 가이드라인을 제공하는 연구가 될 것이다.
Blei, D. (2012). Probabilitic topic models.
CABS (2018). Academic Journal Guide 2018. Retrieved July 5, 2019, from
Chang, J., Gerrish, S., Wang, C., Boyd-Graber, J. L., & Blei, D. M. (2009). Reading tea leaves: How humans interpret topic models. In
Ciomaga, B. (2013). Sport management: A bibliometric study on central themes and trends.
Clarivate Analytics (2019).
DiMaggio, P., Nag, M., & Blei, D. (2013). Exploiting affinities between topic modeling and the sociological perspective on culture: Application to newspaper coverage of US government arts funding.
ESMQ (2019). Aims and scope. Retrieved August 14, 2019 from
Kim, A. R., & Cho, W. J. (2013). A Comparative Study of Sport Management Research Trends: Focused on KJSM and JSM.
Kwon, H. H., Pyun, D. Y., & Lee, C. W. (2008). What is on the Journal of Sport Management? The most popular topics and contexts in the last decade.
Kwon, H. H., Baeck, J. H., & Choi, M. H. (2019). Research topic analysis of the Journal of Sport Management using Topic Modeling.
Parkhouse, B. L. (2005).
Parks, J. B., Zanger, B. R. K., & Quarterman, J. (1998).
Pitts, B., Danylchuk, K., & Quarterman, J. (2014). A content analysis of the European Sport Management Quarterly and its predecessor the European Journal for Sport Management: 1984-2012.
Pitts, B., & Pedersen, P. M. (2005). Examining the body of knowledge in sport management: A content analysis of the Journal of Sport Management.
Shilbury, D. (2011). A bibliometric analysis of four sport management journals.
Shilbury, D., & Rentschler, R. (2007). Assessing sport management journals: A multi-dimensional examination,
Slack, T., & Parent, M. M. (2006).
Sport Management Program Review Council (2000). Sport management program standards and review protocol. national association for sport and physical education and northern American society for sport management: Reston, VA.
Van Doren, C. S., & Heit, M. J. (1973). Where it's at: A content analysis and appraisal of the Journal of Leisure Research.