干旱区资源与环境
    主页 > 期刊导读 >

游客对干旱区景区气候感知的情感分析 ——以

1引言

当前,气候变暖加剧成为全人类共同面对的紧迫威胁[1],高度依赖气候资源的旅游业则成为气候变化的主要“受害者”[2]。近年来,游客对气候变化的感知在学术界被广泛关注[3]。Dubois等认为,游客对天气和气候的感知影响到他们的满意度[4]。一些研究在对西班牙、芬兰的多个或单个旅游区进行实地调查的基础上,运用数理统计类方法得出游客对气候变化持有负面评价[5,6]。在依赖自然资源的滑雪胜地类旅游目的地,游客更易感知到气候变化的危机,且这种危机意识随着时间演变会越来越强烈[7]。相对于红海地区运营商对气候变化的中等感知水平,游客则具有明显的危机意识,两者之间存在着“感知差距”[8]。少数研究在实地调查的基础上运用SEM模型发现游客对天气状况非常宽容,风和低温等天气因素并未显著影响游客对天气的整体评价[9]。总体而言,上述研究基本认为游客已经感知到气候变化的危机,研究以个案为主,数据来源几乎全部来自实地调查。

当前,随着社交媒体时代的到来,对社交媒体大数据进行情感分析可为游客体验满意度研究提供一个新的视角[10-13]。情感分析是关于人们对实体、个体、问题、事件、主题及其属性的看法、评价、态度和情感的计算研究[14]。现有情感分析方法可分为基于情感词典的词典匹配方法和基于语料的机器学习方法两大类[15,16]。刘逸利用基于由知网发布的HowNet词典的词汇匹配技术构建了旅游目的地情感评价模型[17];Kirilenko、邓宁等分别运用SentiStrength、SentiWordNet情感词典的词汇匹配方法分析了游客的情感形象[18,19];Markopoulos等则依托机器学习中的支持向量机(Support Vector Machine,SVM)、朴素贝叶斯(Naive Bayes,NB)比较分析了酒店住客的情感评价值[20];Ye等利用有监督的SVM和NB等方法探讨了欧美旅游目的地的情感体验[21]。总体来说,结果最为精确的人工神经网络分析法(Artificial Neural Network,ANN)的相关成果相对偏少[13,22]。情感分析以目的地研究为对象时,以整体分析居多,专题分析较为少见。

近年来,旅游目的地环境情感分析这一专题研究引起了学术界的高度重视,推动着旅游情感研究向纵深发展。Kirilenko等关注了美国人的感官经历与当地气温变化的联系,并通过回归分析认为大众媒体报道在控制着公众对该主题的情感[23];Becken等运用词汇匹配方法测算了大堡礁旅游生态环境评论的情感值[11];Saura等运用无监督的SVM方法测算了关于西班牙酒店环境的推特评论的情感值[24]。

由此可见,目前环境专题研究对气候的讨论较少,主要为国外成果,而东西方的环境价值观有所不同[25],对我国国内游客进行旅游目的地气候的感知分析是一个值得探讨的重要话题,再考虑到我国的干旱区和半干旱区约占国土总面积的52.5%,且干旱区对全球气候变化响应更加敏感[26],因此本文尝试以我国干旱区5A景区为案例区,收集了游客在新浪微博上发布的有关气候的评论,并利用人工神经网络的这一机器学习法分析评论情感值,同时借助扎根理论范式归纳出低情感值的影响因素。

2数据来源及研究方法

2.1 数据来源

作为一个拥有庞大文本语料库的新浪微博,与Facebook、Twitter等在线社交媒体一样,是情感分析的一个重要数据源[12,27,28]。本研究采用网络爬虫工具获取新浪微博数据。在收集口径方面,基于气候是天气的平均状态[29],对长时段天气的平均状态进行评价,实质是对气候变化评价的考虑。本研究采用“天气”或“气候”+“景区名称”作为关键词采集干旱区气候变化的相关数据,划分标准为内蒙古自治区、新疆维吾尔自治区、甘肃省、宁夏回族自治区、青海省、陕西省、山西省、西藏自治区8个省区[30],并初步选择这8个省区中的5A级景点作为案例地。

在收集时段方面,考虑到新浪微博于2009年创立,故搜索时间限制为2009年1月1日至2018年6月30日。由于本研究是尝试通过游客的叙述洞察气候如何影响旅游情感,故去噪时剔除了来自政府、企业、媒体等干扰数据。获取原始数据条评论,为确保去噪过程更加精准,去噪主要依靠人工完成。由于2009与2010年评论条数低于200,故予以剔除,最终收集到2011年1月1日至2018年6月30日的45家5A级景区共计6721条有效评论,总计50万余字。

2.2 研究方法

本研究采用情感分析和扎根理论相结合的研究方法。在情感分析技术方面,本研究通过编辑程序调动Boson平台的基于中文语料半监督的ANN这一机器学习方法。选择该平台的理由为:①平台能有效对接微博数据。平台的语义语料库是根据微博、论坛等渠道的数据自动构建的,在分析时通过设置URL参数以限定语料库为微博语料库,从而实现无缝对接。②在平台上,基于人工智能算法的ANN方法具有较高的准确率,而方法的相关成果较少见。Kirilenko等给出了准确率等情感分析评估准则的含义和根据表1拟定的评估准则的计算公式[13]。准确率(A)描述了检测结果中正确的话题数量与检测结果的总话题数量的比率;精度(P)描述了检测结果中正确的某类极性的话题数量与检测结果的为同类极性的话题数量的比率;召回率(R)描述了检测结果中正确的话题数量与被测试集中应有的话题数量的比率;F1值集合了精度和召回率这两个评价参数描述了算法的总体优劣。