Spark AWS Dynamo DB

Library for read or write Spark Dataset from/to dynamo db

How to read a Dataset from DynamoDB

Extends DDBDeserializer, creating the structType
create The DDBJobConf indicating the dynamo db details
Use DatasetDDBReader Function

Film Dynamo Deserializer Convert from Dynamo Item to Spark Row

 public class FilmDeserializer extends DDBDeserializer {
 
 
     @Override
     public StructType structType() {
         return DataTypes.createStructType(new StructField[]{
                 DataTypes.createStructField("Film", DataTypes.StringType,false),
                 DataTypes.createStructField("Genre", DataTypes.StringType,false)
         });
     }
 
 }

DDBJobConf

 DDBJobConf ddbconf=DDBJobConf.Builder.newInstance()
                .setDdbRegion(region)
                .setWritePercent(writePercent)
                .setWriteThroughput(writeThoughput)
                .setOutputTableName(outputTableName)
                .setDdbEndpoint(endpoint)
                .create();

Use read Function

Dataset<Row> dataset= new DatasetDDBReader().read(new FilmDeserializer(),ddbconf,session)

How to Write a Dataset from DynamoDB

Extends DDBSerializer and create the fieldList indicating the column Name and the the specific type.
create The DDBJobConf indicating the dynamo db details
read and pass the Dataset to the DatasetDDBWriter function

Film Dynamo Serializer


public class FilmSerializer extends DDBSerializer {
    @Override
    protected List<DDBField> fieldMap() {
          return Arrays.asList(
                new DDBField("Film", StringType.class),
                new DDBField("Genre", StringType.class),
                  new DDBField("Lead Studio", StringType.class),
                  new DDBField("Audience score %", IntegerType.class),
                  new DDBField("Profitability", DecimalType.class),
                  new DDBField("Rotten Tomatoes %", StringType.class),
                  new DDBField("Worldwide Gross", StringType.class),
                  new DDBField("Year", IntegerType.class),
                  new DDBField("Actors", StringType.class)

                  );

    }
}

DDBJobConf


 DDBJobConf ddbconf=DDBJobConf.Builder.newInstance()
                .setDdbRegion(region)
                .setWritePercent(writePercent)
                .setWriteThroughput(writeThoughput)
                .setOutputTableName(outputTableName)
                .setDdbEndpoint(endpoint)
                
                .create();

Write Function

session=SparkSession.builder().master("local").getOrCreate();

inputDataset=session.read.option("header","true").csv("./film.csv);

 new DatasetDDBWriter().write(new FilmSerializer(),ddbconf,session);

Name		Name	Last commit message	Last commit date
Latest commit History 13 Commits
gradle/wrapper		gradle/wrapper
src		src
.gitignore		.gitignore
README.md		README.md
build.gradle		build.gradle
gradlew		gradlew
gradlew.bat		gradlew.bat
settings.gradle		settings.gradle

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Spark AWS Dynamo DB

Library for read or write Spark Dataset from/to dynamo db

How to read a Dataset from DynamoDB

Film Dynamo Deserializer Convert from Dynamo Item to Spark Row

DDBJobConf

Use read Function

How to Write a Dataset from DynamoDB

Film Dynamo Serializer

DDBJobConf

Write Function

About

Releases

Packages

Languages

fulmicotone/spark-dynamodb

Folders and files

Latest commit

History

Repository files navigation

Spark AWS Dynamo DB

Library for read or write Spark Dataset from/to dynamo db

How to read a Dataset from DynamoDB

Film Dynamo Deserializer Convert from Dynamo Item to Spark Row

DDBJobConf

Use read Function

How to Write a Dataset from DynamoDB

Film Dynamo Serializer

DDBJobConf

Write Function

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages