Insight Analytics Task 常见问题

Posted on 2016-06-01(星期三) 00:00 in edx


Insight Analytics Task 常见问题

ImportEnrollmentsIntoMysql

1、错误提示:

1

问题分析:

manifest input_format 错误。

解决方法:

/var/lib/analytics-tasks/analyticstack/repo/override.cfg

修改override.cfg如下配置:

[manifest]
input_format = org.edx.hadoop.input.ManifestTextInputFormat

2、错误提示 2.1

2.2

2.3

问题分析:

数据库链接错误

解决方法:

修改/edx/etc/edx-analytics-pipeline/input.json中参数

3、错误提示

3.1 3.2

错误分析:

重跑任务冲突

解决方法:

1、清理数据

3 3.1

2、修改任务结束时间

4、错误提示

4

错误分析:

无法连接LMS database

解决方法:

注释/etc/mysql/my.cnf中的 bind-address = 127.0.0.1

InsertToMysqlAllVideoTask

1、错误提示 5

问题分析:

没有使video tabInsights中可用

解决方法:

使如下tab可用:

enable_engagement_videos_pages
enable_course_api

2、错误提示 6

问题分析:

没有在insights_env下运行改命令

解决方法:

source /edx/app/insights/insights_env
source /edx/app/insights/venvs/insights/bin/activate
cd /edx/app/insights/edx_analytics_dashboard
./manage.py switch enable_course_api on --create
./manage.py switch enable_video_preview on --create
./manage.py switch enable_engagement_videos_pages on --create
deactivate
sudo -u insights nano /edx/etc/insights.yml (correct all urls)
sudo /edx/bin/supervisorctl restart all

AnswerDistributionWorkflow

1、错误提示

7

错误分析:

Hadoop内存限制

/edx/app/hadoop/hadoop-2.3.0/etc/hadoop/yarn-site.xml 中添加一下属性:

<property>
    <name>yarn.nodemanager.vmem-check-enabled</name>
    <value>false</value>
    <description>Whether virtual memory limits will be enforced for containers</description>
</property>
<property>
    <name>yarn.nodemanager.vmem-pmem-ratio</name>
    <value>4</value>
</property>

InsertToMysqlCourseEnrollByCountryWorkflow

1、错误提示

问题所在位置

--user-country-output $INTERMEDIATE_OUTPUT_ROOT/$END_DATE/user_location --course-country-output $INTERMEDIATE_OUTPUT_ROOT/$END_DATE/country_course

问题分析:

这些变量的路径指向为空

解决方法:

需要下载一个国家ip库并放到cfg中定义的hdfs目录 http://geolite.maxmind.com/download/geoip/database/GeoLiteCountry/GeoIP.dat.gz

2、错误提示

8

错误分析:

因为有某些用户的位置是NULL

解决方法:

/var/lib/analytics-tasks/analyticstack/repo/edx/analytics/tasks# 
vim location_per_course.py

删除py代码中的NOT NULL

修改数据表[reports] course_enrollment_location_current的字段定义

edx