Insight Analytics Task 常见问题
Posted on 2016-06-01(星期三) 00:00 in edx
Insight Analytics Task 常见问题
ImportEnrollmentsIntoMysql
1、错误提示:
问题分析:
manifest input_format 错误。
解决方法:
/var/lib/analytics-tasks/analyticstack/repo/override.cfg
修改override.cfg
如下配置:
[manifest]
input_format = org.edx.hadoop.input.ManifestTextInputFormat
2、错误提示
问题分析:
数据库链接错误
解决方法:
修改/edx/etc/edx-analytics-pipeline/input.json
中参数
3、错误提示
错误分析:
重跑任务冲突
解决方法:
1、清理数据
2、修改任务结束时间
4、错误提示
错误分析:
无法连接LMS database
解决方法:
注释/etc/mysql/my.cnf
中的 bind-address = 127.0.0.1
InsertToMysqlAllVideoTask
1、错误提示
问题分析:
没有使video tab
在Insights
中可用
解决方法:
使如下tab
可用:
enable_engagement_videos_pages
enable_course_api
2、错误提示
问题分析:
没有在insights_env
下运行改命令
解决方法:
source /edx/app/insights/insights_env
source /edx/app/insights/venvs/insights/bin/activate
cd /edx/app/insights/edx_analytics_dashboard
./manage.py switch enable_course_api on --create
./manage.py switch enable_video_preview on --create
./manage.py switch enable_engagement_videos_pages on --create
deactivate
sudo -u insights nano /edx/etc/insights.yml (correct all urls)
sudo /edx/bin/supervisorctl restart all
AnswerDistributionWorkflow
1、错误提示
错误分析:
Hadoop内存限制
在 /edx/app/hadoop/hadoop-2.3.0/etc/hadoop/yarn-site.xml
中添加一下属性:
<property>
<name>yarn.nodemanager.vmem-check-enabled</name>
<value>false</value>
<description>Whether virtual memory limits will be enforced for containers</description>
</property>
<property>
<name>yarn.nodemanager.vmem-pmem-ratio</name>
<value>4</value>
</property>
InsertToMysqlCourseEnrollByCountryWorkflow
1、错误提示
问题所在位置
--user-country-output $INTERMEDIATE_OUTPUT_ROOT/$END_DATE/user_location --course-country-output $INTERMEDIATE_OUTPUT_ROOT/$END_DATE/country_course
问题分析:
这些变量的路径指向为空
解决方法:
需要下载一个国家ip库并放到cfg中定义的hdfs目录 http://geolite.maxmind.com/download/geoip/database/GeoLiteCountry/GeoIP.dat.gz
2、错误提示
错误分析:
因为有某些用户的位置是NULL
解决方法:
/var/lib/analytics-tasks/analyticstack/repo/edx/analytics/tasks#
vim location_per_course.py
删除py代码中的NOT NULL
修改数据表[reports] course_enrollment_location_current
的字段定义