Spark 3.0 readiness part 1 #647

Niharikadutta · 2020-09-01T22:23:24Z

This PR adds support for following APIs added in Spark 3.0:

SparkSession APIs

python def getActiveSession(cls)
scala def executeCommand(runner: String, command: String, options: Map[String, String]): DataFrame

DataFrame APIs

scala/python def tail(n: Int): Array[T]
scala printSchema(level: Int): Unit
scala def explain(mode: String): Unit
scala def observe(name: String, expr: Column, exprs: Column*): Dataset[T]

DataFrameStatFunctions APIs

scala def sampleBy[T](col: Column, fractions: Map[T, Double], seed: Long): DataFrame

This PR addresses part of #633

This reverts commit a766146, reversing changes made to 73db52b. Reverting countvectorizer changes

…ie/spark" This reverts commit ad6bced, reversing changes made to 4c5d502. reverting countvectorizer changes -2

merging latest from master

imback82 · 2020-09-08T04:01:53Z

Can you resolve conflicts? Thanks!

Niharikadutta · 2020-09-13T01:40:08Z

After merging from master, I can see VectorUdf tests failing in collectToPython with java.lang.IllegalArgumentException. I am looking into it.

src/csharp/Microsoft.Spark/Sql/SparkSession.cs

src/csharp/Microsoft.Spark/Sql/DataFrame.cs

src/csharp/Microsoft.Spark.E2ETest/IpcTests/Sql/DataFrameTests.cs

src/csharp/Microsoft.Spark/Sql/DataFrame.cs

suhsteve

LGTM.

imback82

Few nits, but LGTM, thanks @Niharikadutta!

imback82 · 2020-09-18T18:04:18Z

src/csharp/Microsoft.Spark/Sql/DataFrame.cs

+        public void PrintSchema(int level) =>
+            Console.WriteLine(
+                (string)((JvmObjectReference)_jvmObject.Invoke("schema"))
+                .Invoke("treeString", level));


indentation looks off?

Changed, please let me know if that looks better!

You can try the following if the indentation looks funny.

public void PrintSchema(int level) { var schema = (JvmObjectReference)_jvmObject.Invoke("schema"); Console.WriteLine((string)schema.Invoke("treeString", level)); }

src/csharp/Microsoft.Spark/Sql/DataFrameStatFunctions.cs

Niharikadutta and others added 30 commits April 19, 2020 22:31

Adding section for UDF serialization

03b7939

removing guides from master

4ef693d

Merge latest from master

81145ca

merging latest from master

e4b81af

Merge remote-tracking branch 'upstream/master'

4c32173

Merge remote-tracking branch 'upstream/master'

4987a09

Merge remote-tracking branch 'upstream/master'

ca9612e

Merge remote-tracking branch 'upstream/master'

f581c86

Merge remote-tracking branch 'upstream/master'

086b325

Merge remote-tracking branch 'upstream/master'

2f72907

CountVectorizer

6bab996

moving private methods to bottom

e2a566b

changing wrap method

5f682a6

setting min version required

31371db

undoing csproj change

60eb82f

member doesnt need to be internal

ed36375

too many lines

c7baf72

removing whitespace change

d13303c

removing whitespace change

f5b477c

ionide

73db52b

Merge remote-tracking branch 'upstream/master'

98f5e4d

Merge remote-tracking branch 'upstream/master'

4c5d502

Merge branch 'master' into ml/countvectorizer

a766146

Merge branch 'ml/countvectorizer' of https://github.com/GoEddie/spark

ad6bced

Revert "Merge branch 'master' into ml/countvectorizer"

8e1685c

This reverts commit a766146, reversing changes made to 73db52b. Reverting countvectorizer changes

Revert "Merge branch 'ml/countvectorizer' of https://github.com/GoEdd…

255515e

…ie/spark" This reverts commit ad6bced, reversing changes made to 4c5d502. reverting countvectorizer changes -2

Merge remote-tracking branch 'upstream/master'

a44c882

merging latest from master

fixing merge errors

3c2c936

removing ionid

88e834d

Merge branch 'master' of github.com:Niharikadutta/spark

a13de2d

Niharikadutta reopened this Sep 4, 2020

Merge remote-tracking branch 'upstream/master'

ce694ff

imback82 requested review from imback82 and suhsteve September 12, 2020 03:24

imback82 assigned Niharikadutta Sep 12, 2020

imback82 added the enhancement New feature or request label Sep 12, 2020

imback82 added this to the 1.0.0 milestone Sep 12, 2020

Niharikadutta added 2 commits September 12, 2020 16:29

Merge remote-tracking branch 'upstream/master'

8128ba0

resolving merge conflicts

005c818

Niharikadutta closed this Sep 13, 2020

Niharikadutta reopened this Sep 13, 2020

suhsteve reviewed Sep 14, 2020

View reviewed changes

Niharikadutta added 4 commits September 15, 2020 14:08

PR review comments

9d9cb47

Merge branch 'master' into nidutta/spark3.0readiness_part1

23d9b5b

PR review comments

d951c66

removing *ActiveSession APIs

c93ca6c

Niharikadutta mentioned this pull request Sep 16, 2020

Broadcast encryption support #489

Merged

suhsteve reviewed Sep 16, 2020

View reviewed changes

src/csharp/Microsoft.Spark.E2ETest/IpcTests/Sql/DataFrameTests.cs Show resolved Hide resolved

src/csharp/Microsoft.Spark/Sql/DataFrame.cs Outdated Show resolved Hide resolved

PR review comments

187c71a

suhsteve previously approved these changes Sep 16, 2020

View reviewed changes

imback82 reviewed Sep 18, 2020

View reviewed changes

PR review comments

451bc26

Niharikadutta dismissed suhsteve’s stale review via 451bc26 September 18, 2020 18:27

PR review comments

4e9a99c

imback82 approved these changes Sep 18, 2020

View reviewed changes

imback82 merged commit 1ab206d into dotnet:master Sep 18, 2020

Niharikadutta deleted the nidutta/spark3.0readiness_part1 branch September 18, 2020 20:09

suhsteve mentioned this pull request Sep 24, 2020

[FEATURE REQUEST]: Spark 3.0 Readiness #633

Closed

61 tasks

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Spark 3.0 readiness part 1 #647

Spark 3.0 readiness part 1 #647

Niharikadutta commented Sep 1, 2020 •

edited

Loading

imback82 commented Sep 8, 2020

Niharikadutta commented Sep 13, 2020

suhsteve left a comment

imback82 left a comment

imback82 Sep 18, 2020

Niharikadutta Sep 18, 2020

suhsteve Sep 18, 2020 •

edited

Loading

Spark 3.0 readiness part 1 #647

Spark 3.0 readiness part 1 #647

Conversation

Niharikadutta commented Sep 1, 2020 • edited Loading

imback82 commented Sep 8, 2020

Niharikadutta commented Sep 13, 2020

suhsteve left a comment

Choose a reason for hiding this comment

imback82 left a comment

Choose a reason for hiding this comment

imback82 Sep 18, 2020

Choose a reason for hiding this comment

Niharikadutta Sep 18, 2020

Choose a reason for hiding this comment

suhsteve Sep 18, 2020 • edited Loading

Choose a reason for hiding this comment

Niharikadutta commented Sep 1, 2020 •

edited

Loading

suhsteve Sep 18, 2020 •

edited

Loading