카테고리 없음
aws personalize
16비트
2023. 6. 22. 19:43
데이터셋 준비
깃허브에서 데이터셋 다운로드 - item.csv, user-item-interaction.json을 사용할 것임
user-item-interaction.json 파일 형식을 csv파일로 변환하기
https://cdkm.com/kr/json-to-csv
s3에 업로드
Create dataset group
innovate-presonalize
interaction
interactionschema
interactionImport
s3://peach1102/user-item-interaction.csv
데이터를 가져오는 데 실패함. S3 접근이 막혀있기 때문
s3에서 버킷 정책 편집
{
"Version": "2012-10-17",
"Id": "PersonalizeS3BucketAccessPolicy",
"Statement": [
{
"Sid": "PersonalizeS3BucketAccessPolicy",
"Effect": "Allow",
"Principal": {
"Service": "personalize.amazonaws.com"
},
"Action": [
"s3:GetObject",
"s3:ListBucket"
],
"Resource": [
"arn:aws:s3:::peach1102",
"arn:aws:s3:::peach1102/*"
]
}
]
}
이렇게 인터랙션 데이터만 준비해도 personalize를 사용할 준비는 완료가 되었다
하지만 성능적인 부분, cold start의 문제를 해소하기 위해서 item 데이터 셋도 추가적으로 입력함
items
itemschema
{
"type": "record",
"name": "Items",
"namespace": "com.amazonaws.personalize.schema",
"fields": [
{
"name": "ITEM_ID",
"type": "string"
},
{
"name": "ITEM_TITLE",
"type": "string",
"categorical": true
}
],
"version": "1.0"
}
itemimport
s3://peach1102/item.csv
데이터셋 생성이 완료되면 솔루션을 생성
innovate-personalize
innovate-personalize-new-feature
모델이 생성되었다
솔루션을 생성이 완료되면 모델을 배포