카테고리 없음

aws personalize

16비트 2023. 6. 22. 19:43

데이터셋 준비

깃허브에서 데이터셋 다운로드 - item.csv, user-item-interaction.json을 사용할 것임

 

user-item-interaction.json 파일 형식을 csv파일로 변환하기

https://cdkm.com/kr/json-to-csv 

s3에 업로드

Create dataset group

innovate-presonalize

interaction

interactionschema

interactionImport

s3://peach1102/user-item-interaction.csv

 

 

데이터를 가져오는 데 실패함. S3 접근이 막혀있기 때문

s3에서 버킷 정책 편집

{
  "Version": "2012-10-17",
  "Id": "PersonalizeS3BucketAccessPolicy",
  "Statement": [
    {
      "Sid": "PersonalizeS3BucketAccessPolicy",
      "Effect": "Allow",
      "Principal": {
        "Service": "personalize.amazonaws.com"
      },
      "Action": [
        "s3:GetObject",
        "s3:ListBucket"
      ],
      "Resource": [
        "arn:aws:s3:::peach1102",
        "arn:aws:s3:::peach1102/*"
      ]
    }
  ]
}

이렇게 인터랙션 데이터만 준비해도 personalize를 사용할 준비는 완료가 되었다

하지만 성능적인 부분, cold start의 문제를 해소하기 위해서 item 데이터 셋도 추가적으로 입력함

items

itemschema

{
	"type": "record",
	"name": "Items",
	"namespace": "com.amazonaws.personalize.schema",
	"fields": [
		{
			"name": "ITEM_ID",
			"type": "string"
		},
		{
			"name": "ITEM_TITLE",
			"type": "string",
			"categorical": true
		}
	],
	"version": "1.0"
}

itemimport

s3://peach1102/item.csv

 

데이터셋 생성이 완료되면 솔루션을 생성

innovate-personalize

innovate-personalize-new-feature

모델이 생성되었다

 

솔루션을 생성이 완료되면 모델을 배포